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PRÉFACE 


Un des traits les plus typiques de notre époque est l'intérêt. 
croissant aux problèmes de commande, de contrôle et de gestion. 
Comme jamais dans l’histoire, on ressent aujourd’hui la nécessité 
d’une gestion fructueuse et efficace des ressources naturelles et 
humaines, des moyens matériels et techniques. 

Lorsqu'il s’agit des acquis les plus marquants du progrès scien- 
tifique et technique au XXe siècle, on cite le plus souvent la fission 
de l’atome, la conquête de l’espace et la création des ordinateurs. 
Sur ce fond, la théorie de la commande ne semble pas tellement 
remarquable, quoiqu'’elle joue déjà un rôle de pointe dans le déve- 
loppement de la civilisation moderne, et il y a bien des raisons pour 
croire que son rôle ira croissant. 

Partout où la participation active de l’homme est possible, il 
doit faire face au choix de la commande la meilleure possible, ou, 
comme on dit, de la commande optimale. Posés par les exigences 
de l’économie et de la technique, les problèmes d’optimisation ont 
nécessité à leur tour la création de nouveaux chapitres des mathé- 
matiques. 

Ainsi, dans les années 40, l’étude des problèmes économiques. 
a engendré une nouvelle branche de l’analyse, qui fut appelée pro- 
grammation linéaire ou programmation convexe. Pendant ces 
mêmes années, les problèmes de commande d'appareils volants et 
de processus technologiques à structure complexe sont devenus 
actuels. La théorie mathématique appropriée fut bâtie au milieu 
des années 90 et fut appelée théorie de commande optimale. Le 
rôle le plus important y est joué par le « principe du maximum » 
de Pontriaguine. La théorie de commande optimale réalisa une syn- 
thèse des idées et des méthodes de recherche qui, d’une part, pren- 
nent leur source dans les travaux des classiques du calcul des varia- 
tions, et, d'autre part, sont assez récentes. Le développement de 
cette théorie est lié, de manière très essentielle, aux noms de plu- 
sieurs chercheurs soviétiques. 

Ce livre a été conçu comme un manuel de divers cours d’optimi- 
sation, professés dans les universités et dans les institutions d'’en- 
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seignement supérieur où les mathématiques sont situées à un bon 
niveau. Voyons brièvement quels sont les principes de base et le 
plan de l'ouvrage. 

Les débuts de l’histoire des problèmes d’extrémum sont éloignés 
de nos jours: dans une certaine mesure, de tels problèmes ont tou- 
jours attiré l’attention des mathématiciens. Nous cherchons à faire 
découvrir aux lecteurs (de niveaux de préparation différents) la 
continuité du cheminement scientifique et les profondes liaisons 
qui existèrent dans le temps entre ces problèmes. Cette conception 
est développée au [er chapitre, qui est accessible à un très large 
oroupe de lecteurs. Quoique l'appareil mathématique que nous 
y employons est peu développé, nous avons essayé d'effectuer notre 
exposé dans le style d’un texte mathématique précis, nous limitant 
aux fragments les plus expressifs mais élémentaires de l’histoire des 
problèmes d’extrémum. Notre but est de démontrer la liaison pro- 
fonde entre les idées de base dues à Kepler et Fermat, les problèmes 
posés par Huygens, Newton et Bernoulli, les idées et les méthodes 
de Lagrange, Euler et Weïerstrass ainsi que leur interaction avec 
l'étape actuelle du développement de la théorie, étape qui se place 
dans le prolongement direct de la recherche effectuée par ces précur- 
seurs éminents. En outre, le Ir chapitre décrit des méthodes de 
résolution de certains problèmes concrets et donne des exemples 
où la solution de problèmes posés à des époques différentes par des 
chercheurs de différentes écoles est obtenue en se basant sur un 
point de vue unique. 

Le reste du livre est adressé en premier lieu aux mathématiciens. 

La création de la nouvelle théorie a stimulé le développement 
de l’analyse mathématique, de ses branches aussi bien anciennes 
que nouvelles. Celles-ci ne sont pas toutes représentées de manière 
appropriée dans l’enseignement mathématique contemporain. fl 
nous semble que le fragment de l’analyse classique, concentré autour 
du thème des «fonctions implicites », joue aujourd’hui un rôle 
exceptionnel dans tous les aspects de l’analyse, en dimension finie 
et infinie. Il en est de même pour les fondements de l’analyse con- 
vexe. Enfin, il est essentiel, pour la théorie de la commande opti- 
male, que les faits fondamentaux de la théorie des équations diffé- 
rentielles restent valables également pour les équations aux deuxiè- 
mes membres discontinus. 

Les trois branches de l’analyse et de la géométrie que nous venons 
de mentionner sont exposées au [IC chapitre. 

La théorie des problèmes d’extrémum proprement dite est pré- 
sentée dans le IIIe et le IVe chapitres. Essentiellement, leur contenu 
est celui d’un cours obligatoire d’un semestre, professé par les auteurs 
à la faculté de mécanique et de mathématiques de l’Université de 
Moscou. Le texte est préparé de sorte qu’une seule conférence suifise 
à la démonstration des principaux théorèmes. Nous avons partout 
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cherché à donner une exposition complète, en évitant les lacunes, 
les considérations intuitives, « l'évidence », etc. 

Certaines notations standards (provenant de la théorie des ensem- 
bles, de l’analyse fonctionnelle, etc.) sont employées dans le texte 
sans explication. Aussi, pour mieux orienter le lecteur, avons-nous 
ajouté, à la fin du livre, une liste des principales notations, suivies 
des explications nécessaires. 

Les paragraphes dont les numéros sont marqués par un astérisque 
dans le texte et dans la table des matières sont appelés à montrer 
au lecteur les méthodes modernes de la théorie des problèmes d’extré- 
mum. Ici l’exposé est plus proche de celui d’une monographie: 
nous nous permettons des renvois, en nombre minimal, il est vrai, 
à des théorèmes qui, quoique étant classiques, se trouvent encore en 
dehors des programmes traditionnels. Ces paragraphes ont été écrits 
sur la base des cours spéciaux facultatifs « Analyse convexe », 
« Chapitres supplémentaires de la théorie des problèmes d’extré- 
mum » et d’autres, également professés par les auteurs à la faculté 
de mécanique et de mathématiques de l’Université de Moscou pendant 
plusieurs années. 

Le lecteur peut s'informer en plus grand détail sur le contenu 
du présent ouvrage en étudiant la table des matières, dans laquelle 
les principaux résultats et faits exposés dans ce livre sont nommés 
explicitement. 

On voit donc que notre livre est adressé en premier lieu aux étu- 
diants des universités et des institutions d'enseignement supérieur 
à niveau mathématique suffisamment élevé, mais aussi aux ingé- 
nieurs, aux économistes et aux mathématiciens qui se trouvent en 
nécessité de résoudre divers problèmes d'’extrémum. C’est à ces 
lecteurs que nous avons adressé l’Introduction ; pour ceux qui s’in- 
téresseraient à la théorie des problèmes d’extrémum d'une manière 
plus approfondie, nous avons ajouté à notre livre une bibliographie, 
assez complète en ce qui concerne les monographies et les articles 
de revue. 

L'apparition et le développement du cours de commande opti- 
male à la faculté de mécanique et de mathématiques de l’Université 
de Moscou sont surtout le mérite de Serguéi Vassiliévitch Fomine ; 
et c’est à son initiative que nous devons l'apparition du présent 
ouvrage. En le rédigeant, nous nous sommes servis des notes origi- 
nales du cours professé par S. V. Fomine, écrites en collaboration 
avec V. M. Tikhomirov. La mort prématurée de Serguéi Vassilié- 
vitch, en plein essort de ses forces et de son talent, l’ont lésé de la 
possibilité de voir la conclusion de ses efforts. 

Nous exprimons ici notre reconnaissance sincère à nos collègues 
de la chaire des problèmes généraux de commande de la faculté de 
mécanique et de mathématiques de l’Université de Moscou, aussi 
bien pour leur participation active à la discussion des problèmes 
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méthodologiques de l’enseignement du cours de commande optimale, 
que pour leurs remarques concernant le caractère de l’exposition de 
nombreuses questions concrètes abordées dans le livre. 

Nous considérons qu'il est de notre devoir de noter que la forma- 
tion des conceptions mathématiques sur lesquelles se base ce livre 
a été sérieusement influencée par l’activité créatrice de A. A. Mi- 
lioutine. 

Nous remercions À. [. Markouchévitch pour de précieuses con- 
sultations, ainsi que À. P. Bouslaev et G. G. Magaril-Iliaev, qui 
ont lu le manuscrit en détail et fait de nombreuses remarques très 
utiles. 


V. M. Alexéev, V. M. Tikhomirov 


CHAPITRE PREMIER 


INTRODUCTION 


$ 1.1. D’où proviennent les problèmes d’extrémum ? 


Les gens recherchent en général ce qu'il y a de meilleur, et lors- 
que plusieurs possibilités se présentent, leur choix se porte tout natu- 
rellement vers la variante optimale. 

Le mot «optimal» provient du latin optimus, qui veut dire 
meilleur, parfait. Pour choisir la possibilité optimale, on est amené 
à résoudre les problèmes de recherche d’un maximum ou d’un mini- 
mum, i.e. de la plus grande ou de la plus petite valeur d’une certaine 
variable. Ces deux notions — maximum et minimum — se réunis- 
sent en un seul terme: extrémum. Par conséquent, les problèmes de 
recherche des maximums et des minimums sont appelés problèmes 
d’extrémum. 

Les méthodes de recherche et d'étude de diverses sortes de pro- 
blèmes d’extrémum se rapportent à des branches spéciales de l’ana- 
lyse mathématique. À peu près la même signification est donnée 
au titre Problèmes d'optimisation, mais ce dernier reflète plus nette- 
ment la liaison de ces problèmes avec les applications pratiques. 

Le but de cet ouvrage est de familiariser le lecteur avec la théo- 
rie et les méthodes de résolution des problèmes d’extrémum. Mais 
avant d'aborder l'exposition formelle et systématique de cette 
branche des mathématiques, nous ferons un voyage dans l’histoire, 
pour mieux comprendre quelles furent les raisons profondes de poser 
et de résoudre les problèmes d’extrémum sous leur aspect pratique, 
i.e. en tant que problèmes d'optimisation. 


Mercatique solum, facti 

de nomine Byrsam 

Taurino quantum possent 
circumdare tergo. 

Publius Virgilius Maro, Aeneas!) 


1.1.1. Le problème isopérimétrique classique. Problème de Didon. 
Le problème de recherche des plus grandes et des plus petites valeurs 
fut déjà posé dans l'Antiquité. Le problème d'’extrémum le plus 


1) Tant de terre fut achetée et appelée Byrsa que put être entourée par 
une peau de bœuf (Virgile, l’Enéide). 
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ancien est sans doute le problème isopérimétrique classique. Il est 
difficile de dire quand il fut établi que le cercle et la sphère ont la 
plus grande contenance parmi toutes les courbes de même longueur 
ou parmi toutes les surfaces de même aire. Un des derniers repré- 
sentants des platoniciens d'Athènes, Simplicius (VIS siècle ap. 
J.-C.), qui composa peu avant l’écroulement de la civilisation anti- 
que un vaste commentaire sur les œuvres d’Aristote (IVe siècle 
av. J.-C.), écrivait: « Il a été démontré avant Aristote, puisqu'il 
se sert de ce résultat comme d’un résultat connu, et ensuite d’une 
manière plus complète par Archimède et Zénodore, que parmi toutes 
les figures isopérimétriques le cercle est de plus grande contenance, 
tandis que parmi les isopiphanes cette propriété appartient à la 
sphère ». Dans cette citation, nous trouvons la formulation des 
problèmes d’extrémum suivants: parmi les courbes fermées planes 
de longueur donnée trouver celle qui comprend la plus grande aire, 
et, parmi les surfaces fermées d’aire donnée dans l’espace, trouver celle 
qui comprend le plus grand volume. Pour un philosophe de l’école 
platonicienne, un tel problème se présentait tout naturellement : 
il est lié à la recherche des formes idéales. Ce n’est pas par hasard 
que le cercle et la sphère, dans l’Antiquité, symbolisaient la perfec- 
tion géométrique. 

On trouve une motivation plus prosaïque du même problème 
isopérimétrique et de plusieurs problèmes apparentés sous une forme 
plutôt naïve, mais suffisamment claire, dans la légende de la reine 
Didon. Rappelons cette légende, suivant l’Enéide du poète romain 
Virgile, dont deux vers sont cités en guise d’épigraphe ci-dessus. 

La reine Phénicienne Didon, et avec elle un petit groupe d’habi- 
tants de la ville de Tyr, fuyant les poursuites de son frère, le tiran 
Pygmalion, quittèrent leur ville natale et s’embarquèrent vers 
l'Ouest, le long des côtes de la Méditerrannée, à la recherche du 
bonheur. Ayant choisi sur la côte africaine un endroit commode (le 
golfe de Tunis), Didon et sa suite se décidèrent à s’y établir. Il 
semblerait que cette idée n’enthousiasma pas particulièrement les 
habitants du lieu, néanmoins Didon parvint à convaincre leur chef: 
celui-ci eut l’imprévoyance d'accorder à Didon un lopin de terre 
« qui peut être encerclé par une peau de bœuf ». Ce n’est que plus 
tard que ce chef naïf comprit l’astuce et la traîtrise de la Phénicienne. 
Ayant découpé la peau de bœuf en fines lamelles, celle-ci les attacha 
bout à bout, formant une longue corde qui lui permit de délimiter 
un terrain considérable, où elle fonda la ville de Carthage 1). Pour 
rappeler cette histoire, la citadelle de Carthage fut appelée Byrsa *). 
Tous ces événements sont rapportés par la légende à l’année 825 
(ou 814) av. J.-C. 


1) Ce qui signifie « nouvelle ville » en langue phénicienne. 
?) En langue punique (c’est ainsi que les Romains appelaient le langage 
des Carthaginoïs), ce mot signifie « peau ». Ce nom est resté jusqu’à nos jours. 
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En analysant cette situation, nous voyons ici plusieurs possi- 
bilités pour poser un problème d'optimisation. 

A) Il faut indiquer la forme optimale du terrain qui possède 
une aire maximale S pour un périmètre donné Z. 

Il est clair qu'il s’agit ici du même problème isopérimétrique 
classique !). Sa solution est le cercle. 


Exercice. En supposant que la peau de bœuf est un rectangle de 1 Xx 2 
mètres et en prenant l'épaisseur des lamelles égale à 2 millimètres, trouver ZL 
et S$ maximal. 

(Les auteurs n’ont pas su découvrir les dimensions exactes de Byrsa. Située 
sur une colline assez élevée (63 mètres), elle ne pouvait être particulièrement 
grande. LE comparer, la longueur des murs du Kremlin de Moscou est de 
2235 m. 


La solution du problème isopérimétrique est contenue dans l’as- 
sertion suivante : 

Si une courbe rectifiable de longueur L limite une figure plane 
d'aire S,on a 


L?> 4nS, (1) 


l'égalité ayant lieu si et seulement si la courbe est un cercle. 

L'inégalité (1) est dite isopérimétrique; sa démonstration est 
donnée dans 1.6.4; voir également [21]. 

B) On obtient d’autres énoncés du problème si l’on suppose, 
ce qui est naturel, que la reine Didon voulait conserver une issue 
sur la mer. À la différence du problème 
isopérimétrique classique, nous appel- 6 
lerons les problèmes correspondants pro- 
blèmes de Didon. Pour simplifier, envisa- 
geons tout d'abord le cas d’une côte L 
rectiligne (fig. 1). A 

Premier problème de Di- * S ! 
don. Parmi toutes les courbes de lon- Se / 
gueur L contenues dans le demi-plan limi- 
lé par la droite L à extrémités À, B € I, Fis. 1 
trouver celle qui limite, avec le segment | 
[AB], la figure d'aire maximum S. 

Solution. Soit ACB une courbe admissible quelconque 
à extrémités À, B € I qui limite une figure d’aire S (fig. 1). Effec- 
tuons une symétrie par rapport à l/; nous obtenons alors une courbe 
fermée de longueur 2ZL qui limite une figure d’aire 2S. D'après 


1) Une autre situation de la vie réelle qui amène au même problème est 
décrite par Léon Tolstoï dans le conte Faut-il beaucoup de terre à un homme. 
Une analyse de ce conte du point de vue géométrique est donnée dans le livre 
de Y. I. Pérelman Géométrie récréative, Moscou-Léningrad. Gostekhizdat, 1950, 
chapitre 12. 
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l'inégalité isopérimétrique 

(2L)ÿ? > 4n2S, (2) 
d’où l’on obtient 
| S < L?/(2n). (3) 


Par conséquent, la valeur maximale de S peut être seulement ZL?/(2x), 
et cette valeur est effectivement atteinte lorsque ACB est le demi- 
cercle sous-tendu par le diamètre [AB]. Le problème possède une 
solution unique (à translation le long de Z près). 
C) Dans le problème précédent, la position des extrémités À 
et B de la courbe cherchée n'était aucunement fixée, sauf qu'il 
fallait les choisir sur la droite Z. Que se 
ê passera-t-il si ces extrémités sont fixes ? 
Deuxième problème de Di- 
c don. Parmi toutes les courbes de longueur L, 
L situées dans le demi-plan limité par la droite |, 
aux extrémités À, B € L fixes, trouver celle 
A oh 7 qui limite avec le segment [AB] la figure 
D d'aire maximale. 
| Solution. Ilest clair que le pro- 
Fig. 2 blème n’a de sens que si L est supérieur à 
| AB |: en effet, autrement il n’y a aucune 
courbe qui satisfasse aux conditions du problème ou bien (lorsque 
L = | AB |) une telle courbe est unique (c’est le segment [AB] lui- 
même). Îl est naturel de supposer, comme dans le problème précé- 
dent, que la solution sera un arc de cercle sous-tendu par la corde 


[AB]. Un tel arc ACB est uniquement déterminé. Ajoutons-y l’arc 
de cercle complémentaire ADB de manière à obtenir un cercle (fig. 2). 
Désignons la longueur de l’arc ADB par À et l’aire du segment de 
cercle limité par cet arc et par l'intervalle fermé [AB] par ©. 

Soit maintenant ACB une courbe quelconque qui satisfait aux 
conditions du problème et délimite avec [AB] une aire égale à $. 
La courbe fermée ACBD est de longueur Z + À et limite une aire 
égale à S + ©. D’après (1), on a 


an (S + 6) <(L + À}, 


d'où l’on obtient 
: 4 


De même que dans (1), l'égalité, et donc le maximum de S, sont 
atteints si et seulement si la courbe ACBD est un cercle, i.e. lorsque 


les arcs coïncident: ACB = ACB. 

Notons une différence importante entre les deux problèmes con- 
sidérés. Dans le premier problème de Didon, la famille des courbes 
en concurrence est plus grande, puisque la position des points À 
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et B n’est pas fixe. En fait, sans perte de généralité, on peut sup- 
poser que l’un des points, mettons À, est fixe. La position du point B 
est alors déterminée par la condition supplémentaire suivante: 


ACB n'est pas seulement un arc de cercle, comme dans le deuxième 
problème de Didon, mais un dem'-cercle. Sous une forme équiva- 
lente : en ses extrémités, l'arc coupe la droite Z sous un angle de 90°. 
Nous verrons plus loin qu'il s’agit ici d’un principe général: en 
laissant une certaine liberté aux extrémités de la courbe cherchée, 
nous devons postuler des conditions supplémentaires, que l’on appelle 
conditions de transversalité. Quant à la forme des deux courbes dans 


> 


A 





PB 
Fig. 3 Fig. 4 


ces problèmes, elle est la même et se détermine par une équation 
(l'équation d’Euler), qui doit être satisfaite le long de la courbe. 
Dans notre cas, la courbe en chacun de ses points doit posséder la 
même courbure. 

D) Voyons maintenant ce qui se passera si la côte de la mer n’est 
pas rectiligne, en nous limitant au cas des extrémités fixes. On voit 
facilement que si la côte entre les points À et B ne diffère pas trop 


d’une droite, la solution sera toujours le même arc de cercle ACB 
que précédemment. 

La démonstration précédente reste en vigueur, sauf que la lettre © 
doit maintenant désigner l’aire hachurée sur la figure 3. On voit 
aussi ce qui se passera dans le cas où il y a un golfe profond entre 
A et B. Supposons par exemple que la côte entre À et B est recti- 
ligne, mais un canal DC a été creusé à partir du point D, formant un 
angle droit avec AB. En supposant que la limite de la ville doit 
être sur terre ferme, nous voyons que la solution du problème sera 


le même arc ACB tant que le point C est à l’intérieur (fig. 4, à). 


Mais si le canal DC coupe l'arc ACB et l’on a toujours | AC | + 
+ | CB | << L, alors la solution est la courbe constituée des deux 
arcs de cercle AC et CB (fig. 4, b). Au cas limite | AC | + | CB | — 
— JL, la solution est la ligne brisée ACB, tandis que pour | AC | + 
+ | CB [> L la solution n'existe pas. 

La variante de notre problème que nous venons d’envisager peut 
être appelée problème de Didon à contraintes de phase. 


2—0237 
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E) Envisageons maintenant une dernière variante du problème 
de Didon. Supposons que pour une raison quelconque (par exemple, 
à cause de l’interdiction des prêtres d'Eshmoun un temple à l’hon- 
neur duquel avait été construit à Byrsa) on n’a pas le droit de cons- 
truire les murs de la ville sous un angle supérieur à 45° avec la ligne 
de la côte que nous supposons à nouveau rectiligne. Un tel problème 
sera alors un problème de contrôle optimal. Sa solution peut être 


D 


Fig. 5 


trouvée à l’aide du principe du maximum de Pontriaguine qui sera 
exposé par la suite. Dans un cas typique, la solution a l’allure repré- 
sentée sur la figure 5. Les segments AC et BE forment les angles de 
45° avec la ligne de la côte, tandis que CDE est un arc de cercle. 


1.1.2. Autres anciens problèmes géométriques d’extrémum. Ayant 
consacré une place suffisante au problème isopérimétrique, nous 
passons maintenant à l’étude de quelques 
autres problèmes d’extrémum à contenu 
géométrique envisagés par les mathéma- 
ticiens de diverses époques. On trouve 
de tels problèmes, en particulier, dans 
les œuvres des grands mathématiciens 
de l'Antiquité: Euclide, Archimède et 
Apollonios. 

Dans les Eléments d'Euclide (IVe siè- 
cle av. J.-C.), nous rencontrons un seul 
problème de maximum (livre 6, propo- 
sition 27). Sous forme plus moderne, on 
peut l’énoncer de la manière suivante. 
Fig. 6 Problème d'Euclide. Dans 

un triangle ABC donné, inscrire un paral- 

lélogramme ADEF (fig. 6) d’aire maximale. 


D] 


Solution. Le parallélogramme cherché est à sommets D, 


Ê, Ê situés sur les milieux des côtés correspondants du triangle 
donné. Ceci peut se démontrer de différentes façons. Par exemple, 


on montre facilement que les aires des parallélogrammes DDGË 
et FHEF sont les mêmes. D'où l’on déduit que l’aire du parallé- 
logramme ADEF est inférieure à celle du parallélogramme ADEF, 








$ 1.1] D'OÙ PROVIENNENT LES PROBLÈMES D’EXTRÉMUM ? 49 


car cette dernière est égale à l’aire de la figure ADGÉHF qui con- 
tient le parallélogramme ADEF. 

Le problème d'Euclide est, bien sûr, très simple. Par contre, 
les problèmes considérés par Archimède et Apollonios sont beaucoup 
plus compliqués et intéressants. 

Dans les écrits d’Archimède (IIIe siècle av. J.-C.) parvenus jus- 
qu’à nous, le problème isopérimétrique n’est pas mentionné. Nous 
ne savons pas encore ce qui a été fait par Archimède dans ce domaine 
et, par conséquent, la phrase de Simplicius citée dans 1.1.1 reste 
empreinte d’un certain mystère. Mais la 
solution d’un problème isopiphune (i.e. un 
problème qui se rapporte aux figures d’aires 
égales) <e trouve dans un des travaux 
d’Archimède Au sujet de la sphère et du 
cylindre. Il y pose et résout le problème du 
volume maximal des segments de sphère à aire 
latérale fixe. 

La réponse à ce problème est la demi- 
sphère (de même que le demi-cercle était 
la solution du deuxième problème de Didon). 

La plus grande œuvre d’Apollonios 
(ITIe-IIe siècles av. J.-C.) fut son traité 
Coniques ou Sections coniques. Le cinquiè- 
me livre des Sections coniques se rapporte à 
notre thème. Voici ce qu'’écrit Van der 
Waerden: Apollonios avait proposé « le problème de recherche du 
segment de droite le plus long et le plus court qui joint le point 
donné O à une section conique donnée. En fait, il donne plus qu'il 
ne promet. [l détermine toutes les droites qui passent par O 
et coupent la conique sous un angle droït (aujourd’hui ces droites 
sont appelées normales) et analyse pour quelles positions de Ole 
problème possède 2, 3 ou 4 solutions. » En déplaçant le point O, 
il « détermine l’ordonnée des points frontières G; et &, où le nombre 
des normales passant par O change de 2 à 4 et inversement » 
(fig. 7). 

Après la destruction de la civilisation antique, l’activité scien- 
tifique en Europe se met en veilleuse jusqu’à la fin du XVe siècle. 
Le XVIe siècle est marqué par le développement de l’algèbre et 
l’apparition des premiers problèmes d’extrémum à contenu algé- 
brique. | 

Voici, par exemple, un problème proposé par N. Tartaglia 
(XVIe s.): diviser le nombre 8 en deux parties de sorte que le produit 
du produit de ces parties par leur différence soit maximal. 





Fig. 7 


1) Van der Waerden B. L. La science en éclosion. Moscou, Phizmatguiz, 
1959. k 


2% 
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Avant le XVIIe siècle, aucun principe général pour la résolution 
des problèmes d’extrémum n'avait été développé, et chacun de ces 
problèmes se résolvait par une méthode spéciale. En 1615, Kepler 
publia son livre Nouvelle stéréométrie des tonneaux de vin !). Kepler 
commence son livre par les mots suivants: « L’année où je me suis 
marié, les vendanges donnèrent une bonne récolte et le vin était 
bon marché; étant un bon maître de maison, il me fallait faire des 
réserves de vin. J’en achetais plusieurs tonneaux. Après un certain 


Fig. 8 


temps, le commerçant qui me les vendit vint pour mesurer la capa- 
cité des tonneaux afin de me communiquer le prix du vin. Pour 
cela, il faisait pénétrer dans chaque tonneau une barre métallique 
et, sans aucune forme de calcul, nommait immédiatement le contenu 
en vin de ce tonneau. » (Cette « méthode » est illustrée par la fi- 
gure 6.) 

Kepler fut très surpris. Il lui semblait étrange qu'il fût possible 
d'effectuer, grâce à une seule mesure, le calcul de la capacité de 
tonneaux de formes différentes. « Il m'a semblé approprié, écrit 
Kepler, de choisir pour nouvel objet d’étude mathématique les 
lois géométriques d’un système de mesure si commode, et d’en clari- 
fier les fondements. » Pour résoudre le problème ainsi posé, Kepler 
fut amené à décrire les bases du calcul intégral et différentiel et, 
en même temps, à donner les premières règles générales pour la 
résolution des problèmes d’extrémum. Il écrit 2): « Sous l'influence 
d’un bon génie, qui était sans doute tout aussi bon géomètre, les 
tonneliers donnaient à leurs ouvrages une forme telle que la longueur 
de la barre, mesurée dans le tonneau, puisse déterminer la capacité 
maximale de celui-ci; et, puisque auprès de tout point de maximum 
les variations sont peu perceptibles, les erreurs dues au hasard n'exer- 
cent pas d'influence notable sur la capacité. » 


1) Kepler J. Nouvelle stéréométrie des tonneaux de vin. Moscou-Léningrad, 


4935. 
2) Predtetchenski E. A. Kepler, sa vie et son activité scientifique. Pétro- 
grad, Editions Z.I. Grzebine, 1921. 


$ 1.1] D'OÙ PROVIENNENT LES PROBLÈMES D’EXTRÉMUM ? 21 


Les mots mis en italique dans la citation ci-dessus touchent au 
principe fondamental de la recherche de l’extrémum; ce principe 
fut par la suite transformé en théorème, d’abord (pour les polynô- 
mes) par Fermat (1629) et ensuite par Newton et Leibnitz; on l’ap- 
pelle aujourd’hui théorème de Fermat. 

Notons en passant que Kepler trouva la solution de plusieurs 
problèmes d’extrémum concrets, en particulier du problème du 
cylindre de plus grand volume inscrit dans 
une sphère. 

Pour conclure ce sous-paragraphe, envi- 
sageons encore un problème géométrique, 
qui avait intéressé plusieurs mathémati- 
ciens du XVIIE siècle (Cavalieri, Viviani, 
Torricelli, Fermat, etc.). Au XIXe siècle 
ce problème fut étudié par le géomètre 
allemand Steiner, et on l’appelle souvent 
problème de Steiner *). 

Problème de Steiner. Trou- 
ver le point, situé dans le plan d’un trian- 
gle, pour lequel la somme des distances aux 
trois sommets est minimale. 

Solution. Nous donnerons une solu- 
tion géométrique élégante, valable pour 
les triangles à angles aigus. Dans le trian- 
gle ABC (fig. 9), supposons que l’angle C 
est supérieur ou égal à 60°. Effectuons une 
rotation du triangle ABC d'un angle de 60° autour du point C. 
Nous obtiendrons le triangle A’B'C'. Choisissons maintenant un 
point quelconque D dans le triangle ABC et désignons par D’ 
l’image de D par notre rotation. Alors la somme des longueurs 
| AD | + | BD | + | CD | est égale à la longueur de la ligne brisée 
| BD | + | DD' | + | D'À’ |, puisque le triangle CDD’ est équi- 
latéral et | D’A' | = | DA |. : 

Supposons maintenant que D est le point de Torricelli, i.e. le 
point à partir duquel tous les côtés du triangle se voient sous un 


angle de 120”, et D' est l’image de D par la rotation. On voit alors 


facilement que les points 2, D, D' et A’ sont situés sur une même 
droite, de sorte que le point de Torricelli est la solution du problè- 
me. 

Nous avons montré au lecteur quelques problèmes d’extrémum 
à contenu géométrique posés et résolus à diverses époques. Leur 
choix est à peine motivé par des considérations pratiques: nous 
avons surtout cherché à montrer la beauté de la géométrie elle-même. 

1) Remarquons en même temps que des problèmes analogues apparurent 


pee la suite dans la construction des routes, des pipe-lines et des canalisations 
urbaines. 
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1.1.3. Principe variationnel de Fermat et principe de Huygens. 
Le problème de réfraction de la lumière. L’énoncé du premier prin- 
cipe variationnel pour les problèmes de physique est lié au nom de 
Fermat. Il s’agit du principe variationnel de Fermat en optique géo- 
métrique. La loi de réfraction de la lumière fut établie expérimenta- 
lement par Snellius. Peu après, Descartes donna une explication 
théorique de cette loi. D'après Descartes, il s’ensuivait que, dans 
un milieu plus dense (mettons dans l’eau), la vitesse de propagation 
de la lumière serait supérieure à celle dans un milieu moins dense 
(par exemple, dans l’air). Cette idée sembla douteuse à plusieurs 
contemporains de Descartes. 

Fermat trouva une autre explication du phénomène. Son idée 
maîtresse fut la suivante: tout rayon de lumière « choisit » la tra- 
jectoire le long de laquelle le temps néces- 
saire pour passer d’un point à un autre est 
minimal (par rapport aux autres trajectoires 
qui joignent les mêmes points). Pour un 
milieu homogène, dans lequel la vitesse de 
propagation de la lumière en tous les points 
et dans toutes les directions est la même, le 
temps nécessaire pour passer le long d’une cer- 
taine trajectoire est proportionnel à sa lon- 

Fig. 10 gueur. Par conséquent, la trajectoire à temps 

minimal joignant les points À et B est sim- 

plement le segment de droite [AB]: dans un milieu homogène la 
lumière se propage en ligne droite. 

La démonstration de la loi de réfraction de Snellius à partir du 
principe variationnel de Fermat est aujourd’hui exposée dans les 
manuels scolaires (voir également 1.6.1). 

Le principe de Fermat est basé sur l’idée que la lumière se pro- 
page suivant certaines courbes. Huygens (1629-1695) trouva une 
autre explication des lois de propagation et de réfraction de la lu- 
mière, basée sur l’idée que la lumière est une onde dont le front se 
déplace dans le temps. 

En s’abstrayant de l'analyse des fondements physiques de cette 
idée et, en particulier, de la question de la nature même de la lu- 
mière : onde ou faisceau de particules, nous donnerons la définition 
suivante, plus illustrative que rigoureuse. 

On appelle front d'onde S, l’ensemble des points qui sont atteints 
au moment £ par la lumière propagée par la source S,. 

Si, par exemple, la source S, est ponctuelle et le milieu est homo- 
gène, S, est une sphère (« onde sphérique ») de rayon vtet de centre S, 
(fig. 10). Lorsque t augmente, le front d'onde s’élargit uniformément 
dans toutes les directions à la vitesse v. Les lignes de propagation 
de la lumière forment un faisceau de rayons orthogonaux à S; à cha- 
que moment {. Au fur et à mesure que l’on s'éloigne de la source, 
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l'onde sphérique devient de plus en plus plane et, si l’on s’imagine 
la source éloignée à l’infini, le front d'onde à la limite sera un plan 
qui se déplace uniformément à la vitesse v, tout en restant perpen- 
diculaire au faisceau de rayons de lumière, qui sont maintenant 
parallèles entre eux (fig. 11). 

Pour déterminer le mouvement du front d’onde dans des situa- 
tions plus complexes, Huygens se servait de la règle suivante (prin- 
cipe de Huygens). Chaque point du front d’onde S;, peut être consi- 
déré comme une source secondaire et, dans un temps Aë, nous obtien- 
drons une famille de fronts d'onde, engendrée par toutes ces sources 


SA 





Fig. 11 Fig. 12 


secondaires, le front d'onde réel S;}\1, au moment f + At étant 
l'enveloppe de toute cette famille (fig. 12). 

On voit facilement que la propagation de la lumière à partir 
d’une source ponctuelle dans un milieu homogène et le cas limite 
d’une onde plane vérifient le principe de Huygens. En guise d’illus- 
tration du principe de Huygens, appliquons-le pour déduire la loi 
de Snellius (dans le cas du milieu non homogène le plus simple) 
« d’après Huygens ». 

Supposons qu’un faisceau de rayons lumineux parallèles tombe 
sur la frontière plane ZX qui délimite deux milieux homogènes; 
pour simplifier, imaginons que X est horizontale, la lumière tombant 
d'en haut (fig. 13). D'après des considérations de symétrie éviden- 
tes, il suffit de considérer ce qui se passe dans un plan perpendiculaire 
& © et parallèle au faisceau envisagé. Désignons par v, et v, les 
vitesses de propagation de la lumière au-dessus et au-dessous de Z 
et par a, et &, les angles d'incidence et de réfraction (mesurés à par- 
tir de la normale N à >). Le front d’onde À,4,4 se déplace à la 
vitesse v, et, à un certain moment f, la lumière issue du point À 
atteint la frontière Z au point B. Le point B devient alors source 
secondaire d’ondes sphériques qui se propagent dans le milieu inié- 
rieur à la vitesse >. La lumière atteint le point €, au moment 
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= + Er — 


médiaire D € e. au moment {, = { + | BD | sc . Au moment 
1 


sin & : ë : 
— {+ | BC, | = . et arrive au point inter- 
1 


B DRE ET \ 


Fig. 13 


l, l’onde sphérique issue de la source secondaire B aura pour rayon 
Ti Va(ts—t)=|BCil cn sin 4 
et l’onde issue de D 
To = Vo (ta — to) = | DC cd sin Œ4. 


Les tangentes C.C et CC; à ces sphères coïncident, puisque 


NS MS 
sin BC;,C — — sin DCiCo. 








= 2 sin 2? 
ETAT V1 [DC | 


Le point D avait été choisi sur BC; de manière arbitraire et par 
conséquent les ondes secondaires au moment t, ont pour AVPONRE 
la droite CC, qui forme avec ZX un angle &, tel que sin &«, = — sin œ. 
Mais c’est là justement la loi de Snellius 


sin > _ Lo 


Ca e 
sin &, Vs 





Les principes de Huygens et de Fermat sont intimement liés. 
En effet, supposons connue la position du front d’onde $, à un certain 
moment {. Où sera-t-il dans un intervalle de temps Af? Prenons 
un point CE Sy+a: (fig. 14). Par définition, il existe un point 4 € S, 
et un chemin AC effectué par la lumière au temps t + At et, d’après 
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le principe de Fermat, tout autre chemin de À à C nécessite plus 
de temps. Par continuité, on peut trouver un point B sur l'arc AC 
tel que la lumière va de À à B dans le temps t et de B à C dans le 
temps Af. Puisque l’arc AC 
possède la propriété d’être 
minimal, les deux arcs AB 
et BC doivent posséder cette 
même propriété. En effet, s’il 
existait, par exemple, un 
chemin le long duquel la lu- 
mière pouvait aller de À à B 
en un temps inférieur à é, 
alors, en prolongeant ce che- 
min par l'arc BC, nous 
aurions obtenu un chemin de 
À à C'effectué par la lumière 
en un temps inférieur à {+ At, 
ce qui est impossible. D'où 
l’on déduit d’abord que B € S; 
et ensuite que le point C ap- 
partient au front d’onde cor- 
respondant à la source ponc- 
tuelle lumineuse située au point B et à l’instant Af. Ceci s’ac- 
corde parfaitement avec le principe de Huygens: le point B est 
devenu une source secondaire et l’onde qui se propage à partir de 
ce point arrive au point € au moment At. L'idée du front d'onde, 
le principe de Huygens et le raisonnement dont nous avons donné 
ici un aperçu furent le fondement de la future théorie de Hamilton- 
Jacobi et plus tard, au milieu de notre siècle, de la théorie appelée 
théorie de programmation dynamique ; cette dernière est un instrument 
particulièrement important de résolution des problèmes pratiques 
d’extrémum. 





Fig. 14 


+k *  %*% 


A la suite du principe variationnel de Fermat, plusieurs autres 
principes variationnels furent découverts, d’abord en mécanique, 
et ensuite en physique. La majorité des chercheurs en vinrent à croire 
que la nature « choisit » toujours le mouvement de manière à résoudre 
un problème d’extrémum. Ici la citation suivante, due à Euler, est 
appropriée : « Rien ne se passe dans le monde qui ne soit la signi- 
fication d’un certain maximum ou d’un certain minimum. » À une 
époque plus récente, Siegel disait avec humour: « D’après Leiïb- 
nitz, notre monde est le meilleur des mondes possibles, par consé- 
quent toutes les lois se décrivent par des principes d’extrémum. » 


1.1.4. Problème du brachistochrone. Les débuts du calcul des 
variations. En 1696, apparut un article de Bernoulli au titre intri- 
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guant: Problema novum, ad cujus solutionem mathematici invitantur 
(Nouveau problème, à la résolution duquel les mathématiciens sont 
invités). Le problème en question était le suivant: « On donne les 


A 


M 
Fig. 15 


points À et B dans un plan vertical (fig. 19). Déterminer le chemin 
AMB suivant lequel un corps M entraîné par son poids effectuera 
le trajet de À à B en temps minimal » ?). 
La résolution de ce problème, « si beau et jusqu’à présent incon- 
nu », d’après Leibnitz, fut donnée par Jean Bernoulli lui-même, 
par Leibnitz, par Jacques Bernoulli et en- 
x+dx zx Core par un autre auteur anonyme dans 
lequel les spécialistes reconnurent Newton 
«ex unge leonem » (d’après la griffe du lion), 
selon une expression de Bernoulli. La courbe 
de descente en temps minimal ou brachisto- 
chrone s’avéra être la cycloïde. La solution 
de Leibnitz était basée sur l’approximation 
des courbes par des lignes brisées. Déve- 
loppée par la suite dans les travaux d’Euler, 
cette idée fut à la base des méthodes direc- 
tes du calcul des variations. La remarqua- 
Fig. 16 ble solution de Jacques Bernoulli se fon- 
dait sur le principe de Huygens et l’idée 
du front d'onde. Néanmoins, ce fut la solution de l’auteur du pro- 
blème qui jouit de la plus grande popularité. C’est cette solution 
que nous proposons ci-dessous. 

Introduisons dans le plan un système de coordonnées (x, y) en 
prenant l’axe des x horizontal et en dirigeant l'axe des y vers le bas. 
D'après la loi de Galilée, la vitesse du corps AZ au point aux coor- 
données (x, y (x)) (si le corps descend sans frottement le long de la 
courbe y (-), voir fig. 16) ne dépend pas de la forme de la courbe 
y (-) entre les points À et (x, y (x)) et dépend seulement de l’ordon- 





1) Il n'est peut-être. pas superflu de rappeler que des idées pas trop éloi- 
gnées du problème du brachistochrone se trouvent dans les Discorsi de Galilée. 
Celui-ci y démontre qu'en se déplaçant le long d’une corde un corps atteindra 
son extrémité plus tard que s’il se déplace le long de l’arc de cercle sou- 
tenu par cette corde. 


$ 1.1] D'OÙ PROVIENNENT LES PROBLÈMES D’EXTRÉEMUM ? 27 





née y (x); elle est égale à V/ 2gy (x), où g est l'accélération de la 
pesanteur. Il faut alors trouver le temps minimum nécessaire pour 
effectuer le chemin de À à B, i.e. il faut minimiser l’intégrale 


[ ds { ds 
T = as a 
dv JV 
ÀB AB 

où ds est la différentielle de la longueur d’arc. 

Mais, en vertu du principe de Fermat (voir 1.1.3), on obtient 
exactement le même problème en étudiant la trajectoire de la lumière 
dans un milieu non homogène (de dimension deux) lorsque la vitesse 


au point (x, y) est égale à V 2gy. Alors Bernoulli divise le milieu 
en minces couches parallèles dans les- À 

quelles il suppose la vitesse constante et 
égale à v,, i—1, 2, ... (fig. 17). 
D'après la loi de Snellius, on obtient 


sin & _ Sin 2 sin &; Sons. 
VU Ve V3 

où les «; sont les angles d'incidence du 

rayon. En passant à la limite lorsque 

l'épaisseur des couches tend vers zéro Fig. 47 

(il est bien entendu que Bernoulli ne se 

préoccupe aucunement de la légitimité de cette procédure), on obtient 





sin & (x) 


TE M Cte, 


où v(x) = V 2gy(x), tandis que & (x) est l'angle entre la tangente 
à la courbe y(:) au point (x, y(x)) et l’axe Oy, i. e. sin a (x) — 
= 1/V 1+(y’ (x))}2. Ainsi, l'équation du brachistochrone sera 


PAT TEE D UV Y y 
Vi+u}Vy-C=y } Tin Fe. dx. 
Intégrant cette équation (à l’aide de la substitution y=Csin?+., 

dz=C'sin?+ dt), on obtient l'équation de la cycloïde 


2= C++ (t—sin t), y=+(1— cos t). 


Notons la différence entre le problème d’Euclide-Kepler (sur le 
cylindre inscrit) et, mettons, le problème du brachistochrone. L’en- 
semble de tous les parallélogrammes inscrits dans le triangle et 
l’ensemble de tous les cylindres inscrits dans la sphère dépendent 
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d’un seul paramètre. Ainsi, dans ces problèmes, il s’agit de trouver 
l’extrémum d’une fonction d’une seule variable. Par contre, dans le 
problème du brachistochrone, l’ensemble de toutes les courbes qui 
joignent deux points est de dimension infinie. Ici il s’agit de trouver 
l’extrémum d’une fonction d’un nombre infini de variables. Dans 
l’histoire, les mathématiques ont effectué un bond inattendu de la 
dimension 1 directement à l’infini, de la théorie des extrémums d’une 
fonction d'une variable à la théorie des problèmes tels que celui 
du brachistochrone, ï.e. au calcul des variations (comme cette branche 
des mathématiques fut appelée au XVIIIe siècle). 

Peu après les travaux de Jean Bernoulli, de nombreux problèmes 
semblables à celui du brachistochrone furent résolus : celui des cour- 
bes les plus courtes sur une surface, celui de l’équilibre d’un fil 
massif, etc. 

On affirme généralement que l’année de naïissance du calcul des 
variations était 1696, l’année du brachistochrone. Néanmoins cette 
affirmation n’est pas tout à fait exacte, comme nous le verrons dans 
le sous-paragraphe suivant. 


1.1.5. Problème aérodynamique de Newton. En 1687, les Prin- 
cipes mathématiques de philosophie naturelle de Newton furent pu- 
bliés. Dans la septième partie, intitulée Sur le mouvement des liquides 
et leur résistance aux corps lancés, Newton considère le problème de 
la résistance au mouvement d’une sphère ou d’un cylindre d’un 
milieu raréfié 1). Ensuite dans les Commentaires Newton étudie la 
question de la résistance au mouvement d’un cône tronqué qui se 
déplace dans le même milieu raréfié. En particulier, il découvre que 
parmi tous les cônes de même largeur et de même hauteur la plus 
petite résistance se manifeste pour un cône d’angle 135°. Newton 
remarque en passant que ce résultat «n’est peut-être pas inutile 
dans la construction des navires » ; il écrit: « Quod si figura DNFG 
ejusmodi sit ut, si ab ejus puncto quovis V ad axem AB demittatur 
perpendiculum VM, et dicatur recta GP quae parallela sit rectae 
figuram tangenti in À, et axem productam sicet in P, fuerit MN 
ad GP ut GPCub ad 4BP X GB1, solidum quod figurae hujus revo- 
lutione circa axem AB describitur resistetur minime omnium ejus- 
dem longitudinis & latitudinis. » 

Ce texte de Newton peut être traduit de la manière suivante: 
« Lorsque la courbe DNFG sera telle que si l’on abaïsse à partir 
d’un quelconque de ses points V la perpendiculaire sur l’axe AB 
et l’on construit [à partir du point G] la droite GP parallèle à la tan- 
gente à la courbe au point V qui coupe l’axe au point P, [obtenant 
la proportion] MN : GP — GPS : (4BP X GB?), alors le corps 


1) Voir proposition 34, théorème 28 dans le livre de A. N. Krylov Travaux 
A re : Moscou-Léningrad, Editions de l’Académie des Sciences de 
"U.R.S.S., 1936. 
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obtenu par rotation de cette courbe autour de l’axe AB subira la 
plus petite résistance dans le milieu raréfié mentionné ci-dessus 
parmi tous les corps de même longueur et de même largeur » (voir 
la figure 18, due à Newton). New- 
ton n’expliqua pas comment il avait 
obtenu sa solution. Plus tard il 
communiqua à ses commentateurs 
une esquisse de démonstration, mais 
celle-ci fut publiée seulement en 
1727-1729, lorsque la première étape 
du développement du calcul des 
variations était déjà terminée. Des 
notes préliminaires de Newton, pu- 
bliées seulement de nos jours, mon- Fig. 18 

trent qu'il connaissait déjà les 

éléments de plusieurs constructions effectuées ensuite par Euler et 
Lagrange. Nous verrons par la suite que le problème de Newton 
doit être rapporté non pas au calcul des variations proprement dit, 
mais plutôt à la théorie de la commande optimale, dont les 
débuts se rapportent aux années 50 de notre siècle. 





1.1.6. Problèmes de rationnement et de transport. Supposons que 
des réserves d’un certain produit sont stoquées dans plusieurs entre- 
pôts et que ce produit doit être acheminé dans plusieurs magasins. 
Le coût du transport d’une unité de produit de chaque entrepôt 
à chaque magasin est connu, et l’on sait la quantité de produits qui 
doit être amenée dans chaque magasin. Le problème de transport 
consiste à trouver un plan de transport optimal dans cette situation, 
1.e. à indiquer quelle quantité du produit donné il faut transporter 
de chaque entrepôt à chaque magasin, de sorte que le coût total de 
transport soit minimal. Un problème analogue, le problème de ration- 
nement, est le suivant: pour un assortiment d'aliments donnés, 
la contenance de matières nutritives dans chacun d'eux et le coût 
d’une unité de chaque aliment étant donnés, constituer une 
ration qui satisfasse à des conditions appropriées pour un coût 
minimal. 

Des problèmes de ce genre apparaissent très souvent dans l’éco- 
nomie concrète. Les deux problèmes mentionnés ci-dessus se rappor- 
tent à la programmation linéaire. La théorie de la programmation 
Jinéaire fut construite assez récemment: dans les années 40 et 50 
de notre siècle. 


1.1.7. Problème de temps minimum. Nous donnons ici l’exemple 
le plus simple d’un problème extrémal à contenu « technique ». 
Imaginons un wagonnet qui se déplace en mouvement rectiligne 
sans frottement sur des rails horizontaux. Le wagonnet est com- 
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mandé par une force motrice extérieure que l’on peut faire varier 
dans des limites bien définies. Il s’agit d'arrêter le wagonnet dans 
une position déterminée en temps minimal. Ce problème est appelé 
par la suite problème élémentaire de temps minimum. 

Une particularité importante des problèmes d’extrémum tech- 
niques consiste en ce que les forces en question se divisent en deux 
types. L’un d’eux concerne les forces de la nature (mettons, la force 
gravitationnelle), l’autre (mettons, la force de traction) est com- 
mandé par l’homme. Il est naturel qu'’apparaissent alors des con- 
traintes sur les forces commandées, liées aux possibilités techni- 
ques. | 

La théorie de la résolution des problèmes de ce type fut construite 
encore plus tard, à la fin des années 50. On l’appelle théorie de la 
commande optimale. 

* *% * 


D'où proviennent donc les problèmes d’extrémum ? A l’aide des 
exemples ci-dessus, nous avons essayé de montrer qu’il y a beau- 
-coup de réponses à cette question. Les problèmes d’extrémum pro- 
viennent aussi bien des sciences naturelles que de l’économie et de 
la technique, ou apparaissent à cause des besoïns internes des mathé- 
matiques elles-mêmes. Par suite, la théorie des problèmes d’extré- 
mum et son aspect pratique — la théorie de l'optimisation — sont 
devenus particulièrement populaires de nos jours. 


$ 1.2. Comment formaliser un problème d’extrémum ? 


1.2.1. Définitions fondamentales. Chacun des problèmes du pa- 
ragraphe 1.1 avait été énoncé en termes concrets, qui se rapportaient 
au domaine en question. En général, les problèmes d’extrémum se 
posent justement de cette manière, et il n’est pas toujours nécessaire 
de résoudre chaque problème par des méthodes analytiques. Par 
exemple, nous avons donné des solutions purement géométriques 
des problèmes d’Euclide et de Steiner. Néanmoins, si nous désirons 
quand même profiter des avantages de la méthode analytique, il 
faut tout d’abord traduire le problème de la langue « concrète » 
à la langue formelle de l’analyse. Cette traduction sera appelée 
formalisation. 

Un problème d’extrémum bien posé comprend les éléments sui- 
vants: une fonctionnelle !) f : X — KR définie sur un certain ensem- 


ble X et une contrainte, i.e. un sous-ensemble C = X. (Par R nous 
désignons la droite réelle augmentée, i.e. l’ensemble de tous les 
nombres réels auxquels on a ajouté les valeurs —o et vo.) L'en- 


1) Dans la théorie des problèmes d’extrémum, les fonctions numériques 
sont souvent appelées fonctionnelles. 
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semble X est souvent appelé classe d'éléments admissibles, tandis 
que les points x € C sont admissibles pour la contrainte. Alors le 
problème lui-même s’énonce de la manière suivante : trouver l’extré- 
mum (i.e. la borne inférieure ou supérieure) de la fonctionnelle f sous 
condition que x € C. Pour ce même problème, nous nous servirons 
de la notation standard suivante 


f(x) — inf (sup); zxEec. (1) 


Ainsi, pour obtenir un problème précisément posé, il faut décrire 
X, f et C. 

Lorsque X = C, le problème (1) est appelé problème sans con- 
traintes. Un point x sera appelé solution du problème (1), minimale 
(respectivement maximale) ou minimum (maximum) absolu lorsque 
f(x) >f(x) (respectivement f (x) <f (x)) pour tous les EC. 
En général, tous les problèmes seront envisagés comme problèmes 
de minimisation ; on remplace le problème f (x) — sup, x € C, par 
le problème f(x) — inf, x € C, où f (x) — —f (x). Dans les cas où 
nous voulons souligner que le choix entre les problèmes de minimi- 
sation et de maximisation nous est indifférent, nous écrirons f (x) —- 
— extr. 

En outre, l’ensemble X sera généralement muni d’une topologie, 
i.e. on sait ce qu'est la proximité des éléments. Ceci s'effectue, par 
exemple, en choisissant dans X une famille de voisinages (comme 
on le fait toujours dans R” ou dans un espace normé). Si X est un 
espace topologique, le point x est appelé minimum local lorsqu'il 
existe un voisinage U du point x tel que x est la solution du problème 
f (x) — inf, x EC N U. On définit d’une manière analogue le maæxi- 
mum local. 


1.2.2. Premiers exemples de formalisation des problèmes d’extré- 
mum. Nous effectuons ici la formalisation de plusieurs problèmes 
du $ 1.1. Commençons par le problème d'Euclide (voir 
1.1.2, fig. 6). De la similitude des triangles DBE et ABC, nous obte- 
nons À (x)/H = x/b. Ici x est le côté | AF | du parallélogramme 
ADEF, H est la hauteur du triangle ABC, h (x) est la hauteur de 
ABDE et b = | AC |est la longueur du côté AC. L'’aire du parallé- 
logramme ADEF est égale à (H — h (x)) x = H (b — x) x/b. Nous 
obtenons ainsi la formalisation suivante du problème d’Euclide: 


FOLDE sup, OLrSb, r(r—b)int, &E[0,b. (1) 


Les trois éléments qui constituent toute formalisation sont ici les 
suivants : 


X=R, f—H(b—zxzxlb, C=—T[O0, b]. 
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Formalisons maintenant le problème d'Archimède 
sur les segments de sphère isopiphanes (voir 1.1.2). Soit À la hau- 
teur du segment sphérique et R le rayon de la sphère. Le volume 
du segment sphérique, comme on le sait d’après un cours de géo- 
métrie, est égal à x? (R — h/3), tandis que son aire est de 2rRh. 
D'où l’on déduit que le problème d’Archimède peut être énoncé de 
deux manières: 


ah (R—+) sup. 2nRh=a, R>0, 2R>h>0, (2 


où, en éliminant À de la fonctionnelle dans (2), 


Æ — … —+ Sup, 0<h<y/ (2) 
(la dernière inégalité découle du fait que h£2R => a > rh. 
Dans le premier cas X — K*, = rh (R — h/3), C — 
= {(R, h) [2x Rh — a, 2R>h}. Dans 
le deuxième, en posant * — [0, V a/xl, 
nous obtenons un problème sans con- 
traintes avec la fonctionnelle f — 
— hal2 — nh$/3. 

Le problème de Kepler 
concernant le cylindre de volume 
maximal inscrit dans une sphère 
(voir 1.1.2) possède la formalisation 
évidente ci-dessous : 


2nx ( — x) — sup; 0Lzrz<i1 
(X =R, C= 10, 1}. (3) 


Fig. 19 Ici la sphère est de rayon un, tandis 

que x est la demi-hauteur du cylindre. 

La question de laréfraction de la lumière à la 
frontière de deux milieux homogènes, résolue à l’aide du principe 
variationnel de Fermat (voir 1.1.3, fig. 19), se réduit au problème 
suivant. Supposons que les deux milieux homogènes sont séparés 
par le plan z = 0, la vitesse de propagation de la lumière dans le 
milieu d'en haut étant égale à v.,, et celle dans le milieu d’en bas 
à v,. Nous cherchons la trajectoire d’un rayon qui va du point À — 
= (0, 0, &), « > 0, au point B — (Ë, 0, —B), B = 0. D'après des 
considérations de symétrie évidentes, le rayon sera contenu dans le 
plan y = 0. Soit C = (x, 0, 0) le point de réfraction du rayon. 
Alors le temps que met le rayon pour se propager de À à B est égal à 





r(p= VOS, VPFTE SR, 


Vi Vo 
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D'après le principe de Fermat, la coordonnée du point cherché 


x (où doit s'effectuer la EÉAErON) est la solution du problème sui- 
vant 


ACTE: — x)? 
MO PRE LE cn) 
2 


V1 


Remarquons que nous avons obtenu ici un problème sans contraintes. 
Le problème sans contraintes ci-dessous est analogue 


[æ—hi+lrz—él+lx—EË6:1— inf () 
(où X — C — R?, &,, &,, E: sont trois points donnés du plan R?, 
la = VE: c'est la formalisation du problème de 


Steiner (voir 1.1.2). Notons une particularité très importante 
de la fonctionnelle dans le problème (5): elle est convexe, mais non 
partout différentiable. | 

Le problème d’'Apollonios sur la plus courte dis- 
es du point E — (£,, £,) à l’ellipse déterminée par l'équation 


L DE 


— { possède, évidemment, la formalisation suivante 


rs 





GE) +(m—bPint + 1 (6) 


2 2 
ÉNRL 
a? a? | 
1 2 


Ainsi, nous nous sommes familiarisés avec la formalisation des 
problèmes les plus simples. La formalisation des problèmes plus 
complexes qui apparaissent dans les 
sciences naturelles, la technique ou l’éco- 
nomie est en général un problème en soi, 
souvent peu trivial. Dans ces cas, la 
formalisation dépend des hypothèses, 
physiques ou autres. Dans le sous-para- 
graphe suivant nous le montrerons sur 
l'exemple du problème de Newton. 


X—=R?,, C—ix 





1.2.3. Formalisation du problème de 
Newton. La formalisation de ce problème 
dépend, évidemment, des lois de la résis- 
tance du milieu. Newton s’imaginait un 
milieu (qu'il appelait raréfié) constitué Fig. 20 
de particules immobiles de masse fixe m, 
envisagés comme boules élastiques. Nous accepterons également 
cette hypothèse. 

Supposons que le corps de révolution autour de l’axe des x 
(fig. 20) se déplace en direction opposée à celle de l’axe des x (vers 


3—0237 
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le bas) dans le milieu raréfié de Newton décrit ci-dessus, à la vites- 
se v. L'élément dr sur l’axe r décrit autour de l’axe des x un anneau 
d’aire do — 2nr dr et à cet anneau correspond la ceinture dE sur le 
corps de révolution lui-même. Dans l'intervalle de temps dt cette 
ceinture balayera un volume égal à dV = 2xr dr v dt. Supposons 
que p est la densité du milieu. Alors le nombre de particules qui 
entrent en contact avec la ceinture est égal à 


FRANS rs p 25tr dr v dt, 
m m 


où m est la masse d’une particule. Calculons la force dF qui agit 
sur la ceinture d> pendant le temps dt. Supposons que ds forme 
l'angle p avec l’axe r. Effectuant une réflexion sur d>, une particule 
obtient une augmentation de son impulsion égale à m (v; — v,) — 
— — 2mv cos p-n, où v = | v, | = | v, |, n est le vecteur unité nor- 


mal à d> et = arctg = est l’angle que ds fait avec l'horizontale. 


D'après la troisième loi de Newton, le corps obtiendra une augmen- 
tation opposée d’impulsion égale à m 2v cos o-n et, dans l’espace 
de temps dt, il y aura W telles augmentations ; d’après des considé- 
rations de symétrie, la somme des composantes de l’impulsion ortho- 
gonales à l’axe de révolution est nulle, tandis que la composante 
axiale de l’augmentation totale de l’impulsion sera 
2pstr dr v dt 
m 
D'après la deuxième loi de Newton, cette expression est égale 
à dF dt, d’où l’on tire dF — kr dr cos? , k = 4pnv”, et la force de 
résistance totale sera égale à 


R 


r dr 
FER (are. Fe 
0 


Nm2v cos o cos p— m2v cos? p= 4pnv?r dr dt cos? ®. 


Ainsi, si l’on remplace r par t et R par T, on en vient au 
problème d’extrémum suivant 





1 + x? 


On voit facilement, sans résoudre le problème (2) (Legendre fut 
le premier à le remarquer en 1788), que la borne inférieure dans le 
problème est nulle. En effet, si l’on choisit la ligne brisée x (:) 
avec une dérivée très grande en valeur absolue (fig. 21), l'intégrale 
(2) sera très petite. D'autre part, pour toute fonction x (+) l’inté- 
grale dans (2) est non négative. Aïnsi la borne inférieure des valeurs 
de l'intégrale est nulle. 


T 
| 14 inf, 2(0)=0, æx(T)=E. (2) 
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Le phénomène observé ci-dessus a souvent prêté à la critique, 
donnant lieu parfois à des attaques particulièrement méchantes. 
Un des derniers exemples se trouve dans le livre de Young !), qui 
écrit: « Newton formula le problème variationnel concernant la 
forme du corps de révolution qui subit une résistance minimale 
lorsqu'il se déplace dans un gaz. La loi de résistance sur laquelle il se 
fonde est absurde du point de vue physique, et il en résulte que le 
problème qu'il pose n’a pas de solution 
(plus le profil est en dents de scie, plus 
la résistance diminue)... Si la solution 
donnée par Newton était approximative- 
ment vraie, nous n'aurions pas aujour- 
d’hui besoin d'expériences coûteuses dans 
des souffleries aérodynamiques. » Voilà 
qui est dit avec brio! Beaucoup de 
gens trouvent réconfort dans l’idée que 
même les grands hommes ont commis 
des erreurs grossières. Maïs est-ce le Fig. 21 
cas ici? Remarquons tout d’abord que 
Newton lui-même n'avait pas formalisé son problème, ceci fut fait 
par la suite (d’une manière inapte) par d’autres. Pour obtenir 
une formalisation adéquate, il faut prendre en considération le fait 
que le profil envisagé doit être monotone (pour un profil en dents 
de scie, les particules effectuent des réflexions répétées, ce qui donne 
un tableau complètement faussé). La condition de monotonie rend 
notre problème adéquat du point de vue physique. Si l’on prend ce 
fait en considération, la solution du problème de Newton obtenue 
par lui-même n'est pas seulement exacte « approximativement », 
mais elle est remarquablement exacte dans le détail, sur quoi nous 
aurons encore l’occasion de revenir. De plus, les hypothèses physi- 
ques proposées par Newton et la solution même du problème aéro- 
dynamique n’ont pas perdu de leur actualité dans l’aérodynamique 
supersonique de nos jours, où il s’agit de construire des appareils 
volants ultrarapides pour les grandes altitudes. 

L'hypothèse de monotonie nous amène à la formalisation correcte 
suivante du problème de Newton: 








T 
| 1% inf, BO)=0 CPE=E TER. (3) 
n {+2 


1.2.4. Diverses formalisations du problème isopérimétrique clas- 
sique et du problème du brachistochrone. Le problème le plus simple 
de temps minimum. Les deux premiers problèmes mentionnés dans 
le titre de ce sous-paragraphe sont des plus connus, maïs se sont 


1) Young L. Lectures on the Calculus of Variations and Optimal Control 
Theory. London, 1969. 


3+ 
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avérés parmi les plus difficiles quant à l’étude complète. Nous don- 
nerons deux formalisations de chacun d'eux: une formalisation 
traditionnelle bien connue, une autre qui l’est beaucoup moins. 
Nous voulons ainsi souligner que le processus de formalisation n’est 
souvent pas unique, et cela pour des raisons de principe. En effet, 
le choix d’une formalisation commode est un problème en soi: le 
succès ici dépend dans une grande mesure de l’habileté manifestée. 

Commençons par le problème isopérimétrique classique. Etant 
donné la longueur Z de la courbe, déterminons cette dernière par 
les fonctions paramétriques x (+), y (+) en choisissant en guise de 
paramètre la longueur d'arc s, calculée à partir d’un point fixe de 


la courbe. Alors, en tout point, nous aurons la relation x? (s) + 


+ y? (s) = 1, et, en outre, x (0) = x (L), y (0) = y (L) puisque la 
courbe est fermée. 
Pour préciser la position de la courbe cherchée, on peut supposer 


aussi que son centre de gravité se trouve à l’origine des coordonnées, 
L 


1(59 ds — | y (s) ds = 0. L'’aire S 
0 


le. que l’on a les égalités 


© rs HS 


L 
limitée par la courbe (x (+), y (-)) est égale à | xy ds. D'où nous obte- 
0 


nons la formalisation suivante 
É 


S- |aÿds-rsups (5) +02 (91, 
| (1) 


L L 


| x (s) ds — | y(s)ds=0, x(0)=x(L), y(0)=y(L). 
0 0 


Toutefois, ce même problème peut être formalisé différemment. 
Imaginons un avion dont le pilote doit survoler en un temps donné 
une surface d’aire maximale et retourner à son aérodrome. Si la 
vitesse maximale de l’avion ne dépend pas de sa direction de vol, 
le problème donné possède la formalisation naturelle suivante. 

T 


L'aire doit être maximale = | (x(t)v(t)—y(t)u(t)) dd sup, 
( 


où z(t)=u(t), y(t)=v(t). 

La vitesse maximale de l'avion est V = u? + v° < V?. 

L'avion retourne à son aérodrome <>x (0) = x (7), y (0) — 
= y (T). 

Une formalisation plus générale est possible lorsque la vitesse 
maximale dépend de la direction (par exemple, lorsqu'il y a du 
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vent). Nous obtenons alors un problème plus général 


T 
+ | (v—yu) dt sup, t=u, y =, 

0 | 
x(0)=x(T), y(0)=y(T), (u,v)EAÀ, (2) 


où À est l’ensemble de toutes les vitesses admissibles de l’avion. 

Lorsque À est un cercle, nous obtenons le problème isopérimé- 
trique classique, si À est un cercle « déplacé » (ce qui correspond 
à un vent constant), on obtient le problème de Tchaplyguine bien 
connu. 

Passons maintenant à la formalisation la plus traditionnelle du 
problème du brachistochrone. Introduisons dans 
le plan, comme dans 1.1.4 (fig. 16), un système de coordonnées (x, y) 
de sorte que l’axe des x soit horizontal et l’axe des y dirigé vers le 
bas. Sans restreindre la généralité, on peut supposer que le point À 
coïncide avec l’origine des coordonnées. Supposons que les coordon- 
nées du point B (x,, y.) vérifient x, > 0, y, > 0 et que y (+) est 
la fonction qui donne l'équation de la courbe joignant les points 
A et B. Rappelons que d’après la loi de Galilée la vitesse du corps M 
au point (x, y (x)) ne dépend pas de la forme de la courbe y (+) sur 
l'intervalle (0, x), mais seulement de l’ordonnée y (x), et cette 


vitesse est égale à V 2gy (x), où g est l’accélération gravitationnelle. 
Par conséquent, le temps 7 nécessaire pour effectuer le trajet le 


long de la courbe de longueur ds — V dx? + dy? entre (x, y (x)) et 
(x + dx, y (x) + dy) sera égal à ds/Y 2gy (x). D'où nous obtenons 
la formalisation suivante du problème du brachistochrone : 
X1 nt 
; 1 7)2 : 
J@CD= (MECS gr int, yO=0, v(m)=m () 
D V2ey 


Nous donnerons maintenant une autre formalisation du problème 
du brachistochrone, proche dans son idée avec la deuxième formali- 
sation du problème isopérimétrique classique, en suivant l’article 
de Jean Bernoulli de 1696, dans lequel il prend pour point de départ 
le principe variationnel de Fermat. 

Imaginons un milieu non homogène dans lequel la vitesse de 
propagation de la lumière dépend seulement de la « profondeur » 
y suivant la loi v? — 2gy. Alors le rayon de lumière, en vertu du 
principe variationnel de Fermat, effectuera le trajet de À à B en 
temps minimum. Ainsi, nous obtenons une formalisation du pro- 
blème du brachistochrone sous forme de problème de temps minimum 


T — inf, z=Vyu, y=V yv, u? + uv? 2pg, 


z(0)=y(0)=0, 2(T)=z, y(T)=u. (@ 


38 INTRODUCTION [CH I 


D'une manière analogue, on peut formaliser le problème 
le plus simple de temps minimum (voir 1.1.7). 
Supposons que la masse du wagonnet est m, sa coordonnée initiale x, 
et sa vitesse initiale v,. Désignons la force extérieure (la force de 
traction) par uw et la coordonnée variable du wagonnet par x (ft). 


Alors, d’après la loi de Newton, mx = u. Ecrivons la contrainte 
sur la force de traction sous la forme: uw € [u,, u,l. Il vient alors 


T — inf, mx = u, uElu, wl, (5) 
x (0) =r, 2z(0)=v, r(T)=x(T) =0. 


Nous obtenons donc un problème qui ressemble beaucoup à (2) et (4). 

Notons un fait très important. En réalité, nous avons insuffisam- 
ment formalisé nos problèmes. Par exemple, dans la formalisation 
(3), nous n’avons pas indiqué exactement le domaine de définition 
de la fonctionnelle 4 et, par conséquent, nous ne savons pas encore 
quelle classe de courbes on envisage dans ce problème (i.e. l’ensem- 
ble X de 1.2.1 n’est pas défini). Il en va de même avec les autres 
formalisations contenues dans le présent sous-paragraphe. D'ailleurs, 
les mathématiciens classiques ne prêtaient guère attention à la 
formalisation précise du problème et trouvaient la solution du pro- 
blème « non formalisé ». Mais nous voulons être pédants et précis 
autant que possible, et il nous faudra donc nous occuper de cette 
affaire ennuyeuse : indiquer à chaque fois sur quelle classe d'objets 
on cherche (ou on a trouvé) la solution. 


1.2.5. Formalisation du problème de transport et du problème 
de rationnement. Commençons par le problème de transport. Intro- 
duisons les notations suivantes: 

a; — nombre d'unités du produit stocké à l’entrepôt numéro à, 
1<i<m, 

b; — la demande (dans les mêmes unités) du magasin numéro ÿj, 
1<j<n, 

ic;; — coût du transport d’une unité du produit du i-ième entre- 
pôt au j-ième magasin, 

x;; — quantité d'unités de produit à transporter du i-ième entre- 
pôt au j-ième magasin. 

m nn 
Alors le coût total du transport est égal à D, D c;;x;;, il s’agit 
i=i j=1 
de le minimiser. Les contraintes sont alors les suivantes: 

a) z;;5 E R+ (contrainte évidente sur la quantité à transporter) ; 

ñn 


b) > z;; La; (pas moyen de transporter plus de produits qu’il 


= 
n’y en a en stock); 
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m 
c) z;;,-=b; (il faut transporter exactement la quantité requise). 


1— 
Il en résulte la formalisation suivante: 


m 


n n m 
2 Cijtij > inf, 2 Ti; Li, 2 Tij=0;, %;;ER+ (1) 
1= î—= i—= 


Le problème de rationnement se formalise tout 
aussi simplement. Supposons qu’il y a n aliments (grains, lait, etc.) 
et m substances nutritives (lipides, protides, glucides, etc.). Sup- 
posons qu’il faut b; unités de la j-ième substance pour une alimen- 
tation saine. Supposons en outre que a;; est la quantité de j-ième 
substance contenue dans une unité du i-ième aliment et que c; est 
le prix d’une unité du i-ième aliment. 

Désignons par x; la consommation du i-ième aliment, nous obte- 
nons alors le problème 


1= 


n ñn 
2: cit inf, DATA x, >. (2) 
i— i= 


1.2.6. Principales classes de problèmes d’extrémum. Nous avons 
déjà mentionné brièvement dans le $ 1.1 que plusieurs classes de 
problèmes se sont assez clairement délimitées dans la théorie des 
problèmes d’extrémum. Avant de les décrire, passons en revue les 
méthodes grâce auxquelles on s'était donné les contraintes dans les 
problèmes énoncés ci-dessus. 

D'abord nous avons rencontré des formalisations où les contrain- 
tes étaient totalement absentes (par exemple, dans le problème de 
la réfraction de la lumière ou dans le problème de Steiner). Deuxiè- 
mement, il y avait des contraintes déterminées par un système d’éga- 
lités (par exemple, dans le problème d’Apollonios, dans le problème 
du brachistochrone (dans sa formalisation (3), 1.2.4), où les égalités 
donnaient les conditions aux limites). Troisièmement, les contrain- 
tes étaient données par des inégalités (par exemple, dans le problème 
de transport). Enfin, quatrièmement, certaines contraintes s’écri- 


vaient sous forme d'’inclusions (par exemple, la contrainte x € R. 
dans le problème de Newton, la contrainte (u, v) € À, où À = 
= {(u, vu); u? + v° L 1}, dans le problème isopérimétrique classique 
(dans sa formalisation (2), 1.2.4). 

Notons que cette division est un peu artificielle. Par exemple, la 


contrainte x € R. dans le problème de Newton peut s’écrire sous 


forme d’inégalité x > 0, tandis que la contrainte (u, v) € À dans 
le problème isopérimétrique classique s'écrit également sous forme 
d’inégalité u? + v* < 1. Réciproquement, chaque inégalité f (x) < 
< 0 peut être remplacée par l'égalité f (x) + u = 0 et l’inclusion 
u € R, etc. 
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Toutefois, d’après le point de vue adopté dans ce livre, la diffé- 
rence entre les contraintes sous forme d'égalités et d'’inégalités 
d’une part, et d’inclusions de l’autre, n’est pas dénuée de signifi- 
cation. On rencontre dans les cours d’analyse (nous en parlerons en 
détail dans le $ 1.3) la méthode des multiplicateurs de Lagrange pour 
la résolution des problèmes d’«extrémum lié ». Il est bien connu que 
l’application de cette méthode commence par la construction de la 
« fonction de Lagrange », qui comprend aussi bien la fonctionnelle 
considérée que les fonctions qui déterminent les contraintes. Il peut 
s'avérer, pour diverses raisons, qu'il soit avantageux de ne pas intro- 
duire certaines contraintes dans la fonction de Lagrange. Ainsi donc, 
nous distinguons, en les mettant sous forme d’inclusions, celles des 
contraintes qui, dans la solution du problème envisagé, ne sont pas 
inclues dans la fonction de Lagrange. Dans ce cas, de même que pour 
la formalisation du problème (où il y a plusieurs méthodes et le 
choix d’une méthode avantageuse dépend de l’art du chercheur), 
le problème de la distinction des contraintes n’a pas toujours une 
solution préférentielle. 

Passons maintenant à la description des classes principales de 
problèmes d’extrémum. Par la suite, d’un point de vue assez général, 
nous envisageons les quatre classes suivantes. 

I. Problèmes différentiables à contrain- 
tes sous forme d’égalités et d'inégalités. 
Ici la classe des éléments admissibles X sera en général un espace 
normé 1), tandis que les contraintes C sont déterminées par l'égalité 
F (x) = 0, où Fest une application de X dans un autre espace normé 
Y, et un nombre fini d’inégalités f, (x) < 0, i = 1, ..., m. On 
obtient de la sorte la classe de problèmes suivante: 


fox) — inf, F(x)=0, fix)<0, i=1,...,m. (1) 


On admet ici que les fonctions f;, à — 1, 2, ..., m et l’applica- 
tion } possèdent certaines propriétés de différentiabilité. Le pro- 
blème différentiable f, (x) — inf sera appelé problème différentiable 
élémentaire *?). 

II. Calcul des variations classique. Ici la 
classe traditionnelle des éléments admissibles est l’espace de Banach 
X = Ct(fé,, t.1l, R7) des fonctions vectorielles de dimension nr 
continâment différentiables x (+) — (x, (+), ..., x, (-)) dans lequel 


1) Les termes « espace normé » et « espace de Banach » sont employés ici 
uniquement pour préciser l'énoncé du problème. Le lecteur trouvera les défi- 
nitions exactes dans 2.1.1. Dans le problème (1), on peut supposer pour simpli- 
fier que x = (r1, . .., æ,) est un vecteur dans l’espace arithmétique R? à n di- 
mensioOns. 

2) Les problèmes de maximum, ou à l'inégalité de sens opposé (>), se 
ramènent facilement à la forme (1), voir $ 3.2. 
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la norme est définie par les formules 


La (-) a = max (x (los [x (lle), 


Ix(-)o= max ( max Je (&)1). 
ISi<n tElto,t 


Les fonctionnelles dans ” problèmes du calcul des 
variations classique sont généralement des types suivants: 
intégrales, i.e. des fonctionnelles de la forme 


1 


Ja()=|L( a, à) dt = 
° t1 e e. 
= {La (0 0 m0) À) 
to 


terminales, i.e. des fonctionnelles de la forme 
TFx{-)) = Lx (bo), à (h)) = 
— l(t (to); ss Ln (to); T1 (£), ss ln (£1)) ; (3) 
mixtes, i.e. des fonctionnelles de la forme 
B (x (C) = JC) + TC). (4) 
(Par la suite les fonctionnelles de la forme (4) seront également appe- 
lées fonctionnelles de Boltz.) 
Les contraintes dans les problèmes du calcul des varia- 
tions classique se décomposent généralement en deux parties: 
les relations différentielles de la forme 
M (t, 2 (6, à (0) = 0 <> Mi (6, an (Ë), + + + Œn (6), Æa (6) + + 
.. En (0) =0, Le is ss D (5) 
les conditions aux limites de la forme 
Ÿ (x (to); x (t)) — 
= 0 1; (21 (bo), + +, Zn (to), Li (Ë1), + + +; Xn (ti); (6) 
1 lis 
Dans (2) et (5) L, M; et dans (3) et (6) Z, +; sont des fonctions 


différentiables de 2n + 1 et 2n variables respectivement. Le pro- 
blème 


Jæ()h—inf, M(zx 2 =0, vpr(t), zh) =0 (7) 
est appelé problème de Lagrange. Le problème 
Bat) inf, Mtz, 2) —=0, v(x(t), x(t))= 0 


49 INTRODUCTION [CH. I 
est le problème de Boltz. Le problème 
T(c(h—inf, Max 2) =0, v(x(t), x (h)) =0 


est appelé problème de Mayer. 
Le problème sans contraintes 


BC) \L(E, 20), 20) dt+1((t), z()+inf (8) 


to 


sera appelé problème élémentaire de Boltz. 
Le problème 


JCH=TL(E 20, 2(@)dt+int, se (= (0) 


to 


est appelé problème élémentaire vectoriel du calcul des variations clas- 
sique et, dans le cas où n = 1, c’est le problème élémentaire du calcul 
des variations classique. Pour simplifier, nous nous limitons ici aux 
problèmes à temps fixe. 

Une formulation plus générale, dans laquelle la fonctionnelle 
et les contraintes dépendent également des variables t, et t{,, peut 
être trouvée par le lecteur au chapitre IV. 

III. Problèmes de programmation con- 
vexe. [ci la classe des éléments admissibles X est un espace vecto- 
riel, tandis que les contraintes C sont données par un système d’éga- 
lités F (x) = 0 (où F : X —+ Y, Y étant un autre espace vectoriel), 
d’'inégalités f; (x) 0, i = 1, 2, ..., m et d'inclusions x € À. 
On obtient ainsi la classe de problèmes suivante: 


Jo@&)— inf, Fa) =0, f(x) <0, i=1,...,m, 
x € À. (10) 


Nous supposons ici que les fonctions f;, à — 0, 1, ..., m sont con- 
vexes, l'application F est affine (ï.e. F (x) = Ax + n, où n est 
un vecteur fixe, tandis que À est un opérateur linéaire de X dans Ÿ) 
et À est un ensemble convexe. Si toutes les fonctions f; dans (10) 
sont linéaires, tandis que À est un cône standard, le problème (10) 
est appelé problème de programmation linéaire. Lorsque les contraintes 
sont absentes de (10), le problème f, (x) — inf avec une fonction 
convexe f, Sera appelé problème convexe élémentaire sans contraintes. 

IV. Problèmes de commande optimale. Dans 
ce livre nous envisageons la classe suivante de problèmes de com- 


$ 1.2] COMMENT FORMALISER UN PROBLÈME D’EXTREÉMUM ? 43 


mande optimale, où xE R", u ER: 


FC), u() do h)= 


l1 
= | fG, x (6), u (t)) dt + g (to, x (to), da, x (4)) inf, (11) 
to 


z=pt,zx.u), vi, ct), li, ch) =0, uEU. 


On suppose en général que les temps t, et {, ne sont pas fixés 
dans (11), toutes les fonctions 


ÉRXRX RER, o:RX RTX R'— R7, 
v'RXRXRX R— R, g:RX RXRX RT—=R 


sont continûment différentiables relativement aux variables t et x 
et continues par rapport à leurs variables; l’ensemble 1 est en 
général un sous-ensemble quelconque de KR. 

Pour donner une description complète du problème, il ne reste 
qu'à expliquer quelle est la classe des éléments admissibles. Au 
début nous considérerons l’ensemble des fonctions vectorielles 
{x (+), u(-))}, où u (+) est définie et continue par morceaux sur 
lt, til, l'inclusion u (t) € U étant satisfaite pour tous les t, tandis 
que x (-) est continue sur [£,, t.l et différentiable en tous les points, 
sauf ceux où u (-) possède une discontinuité; dans tous les points 


où la dérivée de la fonction x (+) existe, on a l'égalité x (t) = 
= qi, x (D, u (D). | … 

Les problèmes dans lesquels la fonctionnelle envisagée est 4, 
sont appelés problèmes de temps minimum. 


+ + + 


Nous pouvons maintenant voir dans quelles classes il faut inclure 
les problèmes des sous-paragraphes 1.2.1 à 1.2.5. 

Le problème d’'Euclide (voir (1), 1.2.2) peut être 
aussi bien rapporté aux problèmes différentiables qu’aux problèmes 
de programmation convexe. Le problème d'Archimède, 
dans les formalisations (2) et (2”) de 1.2.2 et le problème de 
Kepler (3) de 1.2.2 se rapportent aux problèmes différentiables. 
Le problème de la réfraction de la lumière 
{voir (4), 1.2.2) est à la fois un problème différentiable élémentaire 
et un problème convexe élémentaire. Le problème de Stei- 
ner (voir (5), 1.2.2) est un problème convexe élémentaire. Le 
problème d'Apollonios (voir (6), 1.2.2) est un problème 
différentiable à contraintes sous forme d'’égalités. Le problème 
de Newton (voir (3), 1.2.3) est un problème de commande 
optimale. Le problème isopérimétrique classi- 
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que dans la formalisation (4) de 1.2.4 se rapporte au calcul des 
variations classique, et dans la formalisation (2), à la théorie de 
commande optimale. Le problème du brachisto- 
chrone (voir (3), 1.2.4) est un problème élémentaire du calcul 
des variations classique ; ce même problème dans la formalisation 
(4), 1.2.4, est le problème de temps minimum de commande opti- 
male. Le problème de transport etle problème 
de rationnement (voir (1) et (2), 1.2.5) sont des problèmes 
de programmation linéaire; le problème élémentaire 
de temps minimum est un problème de commande opti- 
male. 

Ainsi nous avons formalisé et classifié nos problèmes. Voyons 
maintenant ce que nous donne l’analyse pour les résoudre. 


$ 1.3. Méthode des multiplicateurs 
de Lagrange et théorème de Kuhn-Tucker 


1.3.1. Théorème de Fermat. La première méthode analytique 
générale pour la résolution des problèmes d’extrémum fut conçue 
par Fermat. Elle aurait été découverte en 1629, maïs elle fut pleine- 
ment exposée pour la première fois dans une lettre à Roberval en 
1638. Nous conseillons au lecteur de consulter le livre de Descar- 
tes !), où cette lettre est citée, et essayer de comprendre l’idée ori- 
ginale de Fermat. En langue plus moderne (à vrai dire, Fermat ne 
considérait que les polynômes) la méthode de Fermat consiste à re- 
marquer qu'en un point d'extrémum x, dans le problème sans con- 
traintes f (x) —+ extr, on doit avoir l'égalité f'(x) — 0. Nous nous 
rappelons qu’une première allusion à ce résultat est contenue dans 
une phrase de Kepler provenant du livre Stéréométrie des tonneaux de 
vin, que nous avons cité ci-dessus. 

Le raisonnement de Fermat fut mis sous une forme précise en 
1684, quarante-six ans plus tard, lorsque apparut l’ouvrage de Leib- 
nitz dans lequel celui-ci posa les fondements de l'analyse. Le titre 
même de cet ouvrage, qui commence ainsi: Vova methodus pro maxi- 
mis et minimis... (Nouvelles méthodes pour la recherche des plus petites 
et des plus grandes valeurs...) nous montre l'importance du problème 
d'extrémum dans le développement des mathématiques modernes. 
Dans son article, Leibnitz n'obtient pas seulement la relation 


j' (x) = 0 en guise de condition nécessaire d’extrémum (aujourd’hui 
ce résultat est appelé théorème de Fermat), mais se sert de la deuxième 
différentielle pour distinguer le maximum du minimum. Il faut 
sans doute rappeler que, bien entendu, la majorité des faits exposés 
par Leibnitz était à cette époque également connue de Newton. 


1) Descartes R. Géométrie (avec en Appendice Travaux choisis de P. Fer- 
mat et Correspondance de Descartes). Moscou-Léningrad, 1938, p. 154. 
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Mais son ouvrage La méthode des fluxions, achevé dans ses grandes 
lignes en 1671, ne fut publié qu’en 1736. 

Passons maintenant au théorème de Fermat proprement dit, en 
rappelant d’abord quelques faits d'analyse. Commençons par le cas 
unidimentionnel, lorsque les fonctions sont définies sur la droite 
réelle R. La fonction f: R — KR d’une variable est dite différentiable 


au point x, s’il existe un nombre « tel que 


f(x+ 2) = f(œ)+aù+r (à), 
où r (4) — o(|À |), i.e. pour chaque € >> O0 il existe un Ô > 0 tel 
que |A | 6 implique [r (D) | Le | À |. Le nombre «& est appelé 
dérivée de f au point x et désigné par f'(x). Ainsi 


f' (= lim [(/(c+ 2) 7 OAI. 


Théorème de Fermat. Supposons que f est une fonction 
d'une variable, différentiable au point x. Si x est un point d’extrémum 


local, alors | 
f(x) = 0. (1) 


Les points x auxquels on a la relation (1) sont dits stationnaires. 

D'après les définitions générales de 1.2.1, le point x donne un 
minimum (maximum) local à la fonction f s’il existe un e > 0 
tel que l'inégalité |x — x | << e implique l'inégalité f (x) > f (x) 
(<] (x)). D'après le théorème de Fermat, les points d’extrémum local 
(maximum ou minimum) sont stationnaires. La réciproque est évi- 
demment fausse: par exemple f (x) — xÿ, x = 0. 

Démonstration. Supposons que x est un minimum local 
de la fonction f, mais f’ (x) — « = 0. Supposons pour préciser que 
a << 0. En se donnant € — | & |/2, trouvons d’après la définition 
de la dérivée un nombre ô = 0 tel que | À | à entraîne | r (à) | < 
<< |æ@œ||A/|/2. Alors, pour 0 À << Ô, on obtient 


[al À | Œ 


FG+A =) +ai+r A) (art; el Li, 








i.e. x n’est pas un point de minimum local de f. Cette contradiction 
démontre le théorème. I 

Pour plusieurs variables (et à fortiori pour « un nombre infini 
de variables ») il y a plusieurs définitions de la dérivée. Nous y re- 
viendrons en détail dans le chapitre IT (voir 2.2.1). Nous rappelons 
ici seulement la définition principale (due dans le cas de dimension 
infinie à Fréchet). 

La fonction f: R®—R de n variables est dite différentiable au 
point x, s’il existe des nombres (a, ..., &,) (que nous désignerons 
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brièvement par a) tels que 
f@+R)=f(@)+Z œihitr (x), 


où |r(h)|—=o(|h|), i. e. pour chaque e > 0 il existe un Ô>=>0 tel 
que [Al=YV h?+... 4h? <6 implique |r(h)| Le]lh]. Le système 
a—(@, ..., &,) est appelé dérivée de f au point zx; on le désigne 
également par f’ (x). Notons que f’ (x) est une suite de 7 nom- 
bres. Dans notre cas, le nombre 


ai lim [(f (&+ he) — f (AI, 


Où e;—(0,..., 1,..., 0) (le chiffre 1 étant situé à la i-ième 
place), est appelé i-ième dérivée partielle de jf; notation: fx, (x) 


Les Am 


ou 2 (2). Ainsi, f' (2) = (fas (2), -.. fan (9). La relation f’ (à=0 


signifie que fx. (t)=... = fx, (&)=0. 

On déduit du théorème de Fermat « unidimentionnel » le corollai- 
re évident suivant: 

Corollaire (Théorème de Fermat pour les 
fonctions de n variables). Soit f une fonction den 
variables, différentiable au point x. Si xestun point de minimum local 
de la fonction f, alors 


f'(D=0—f,,(r)=0, i=1,...,n. (2) 


Les points x € R” auxquels on à l'égalité (2) sont également 
appelés stationnaires. 

Démonstration du corollaire. Si x donne un 
extrémum à la fonction jf, alors le point zéro doit être un extrémum 
de la fonction œ; (À) = f (x + e;). D'après le théorème de Fermat 


def & 
gi (0) = 0, mais gif (0) = fx, (@). 

1.3.2. Méthode des multiplicateurs de Lagrange. Ce sous-para- 
graphe concerne les problèmes différentiables de dimension finie. 
Signalons encore une fois les méandres historiques qui caractérisent 
le développement de notre thème. Après la création des méthodes 
pour résoudre les problèmes d’extrémum unidimensionnels, vint 
le tour du calcul des variations classique. Pour les problèmes du 
calcul des variations à contraintes, i.e. dans une situation de dimen- 
sion infinie, Lagrange énonça dans sa Mécanique analytique (1788) ?) 
sa célèbre méthode des multiplicateurs ; ce n’est que neuf ans plus 
tard, dans sa Théorie des fonctions analytiques, en 1797, qu’il appliqua 
cette méthode aux problèmes de dimension finie. 


1) Lagrange J. Mécanique analytique. Moscou-Léningrad, Gostechizdat, 
4950. 
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On appelle problème d’extrémum différen- 
tiable de dimension finie à contraintes 
sous forme d'égalités (ou problème d'extré- 
mum lié)le problème suivant: 


fo(@—extr, (2 =... = fm (œ) = 0. (1) 


Les fonctions f,: R°— KR, k — 0, 1, ..., m, doivent ici possé- 
der certaines propriétés de différentiabilité. Dans ce sous-paragraphe, 
nous supposons que dans un voisinage ouvert U de l’espace R” toutes 
les fonctions f, possèdent des dérivées continues (dans le sens que 
toutes les dérivées partielles 0/f,/0x; existent et sont continues 
dans U). 

Le point x EU, fr (x) =0, k = 1,2, ..., m, donne un mini- 
mum (maximum) local au problème (1) dans le cas où il existe un 
e >> 0 tel que pour un point x € U vérifiant toutes les contraintes 


(Gi (x) =0, i=1,...,m)et |z—z|<e, on à fo (x) > fo (a) 
(respectivement f, (x) < fo (x)). 
La fonction 


L = EL (x, À, ho) — RE hrfr (x); (2) 
R=0 
OÙ À = (À,,..., Am), eSt appelée fonction de Lagrange du problème 
(1) et les nombres À4, À1, . . ., Âm Sont les multiplicateurs de La- 
grange. 
Méthode des multiplicateurs de La- 
grange. {. Supposons que toutes les fonctions fo, fi; + : :» Îm AU pro- 


blème (1) sont continûment dif jérentiables dans un voisinage du point z. 
Si xest un point d'extrémum local du problème (1), il existe des multi- 
plicateurs de Lagrange À — (Â, es Nm) et Ào gui ne s’annulent pas 
simultanément et qui vérifient la condition de stationnarité de la fonc- 
ion de Lagrange par rapport à x 


La (Es à ho) = 0 La, (& Aus ces Âms Ào) = 0, (3) 
Li 2 sis 
2. Pour que À 0, il suffit que les vecteurs f. (x), us là (x) 
soient linéairement indépendants. 


Ainsi, pour déterminer x, À et À,, nous avons obtenu n +m 
équations : 





m 
Ô - , 
(D hf())=0, it, ...,n, Hh@=...=fn(=0 (à 
k=0 
à n + m + À inconnues. Il faut remarquer que les multiplicateurs 
de Lagrange se trouvent donc définis à un coefficient de proportion- 
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nalité près. Si l’on sait que À, = 0 (ce qui est le cas le plus important, 


car avec À — 0 les relations (3) reflètent seulement le fait que 
les contraintes sont dégénérées, et n’ont rien à voir avec la fonc- 


= 


tionnelle), on peut, en multipliant tous les À; par une constante, 


supposer que l’on a l'égalité À, — 1. Dans ce cas, le nombre des 
équations devient égal au nombre des inconnues. 

Sous une forme plus symétrique, on peut écrire les équations (4) 
ainsi : 


Dot 0 (4”) 


Leurs solutions sont appelées points stationnaires du problème (1). 
Depuis le temps de Lagrange (les mots de Lagrange sont cités 
plus loin), pendant presque un siècle, la méthode des multiplica- 


teurs était énoncée avec À, — 1; mais sans hypothèses supplémen- 
taires (par exemple, d'indépendance linéaire) elle s'avère fausse. 
Pour confirmer ce que nous venons de dire, considérons le problème 


: 2 Do e 
mini, x + x = 0. 


Sa solution évidente et unique est le point x = (0, 0), car c’est le 
seul point admissible. Essayons maintenant de constituer une fonc- 


tion de Lagrange avec À, — 1 et d'y appliquer l'algorithme (3). 
On a £ — x + À (x? + x°), d’où l’on obtient 
0 


Ôx; du 


O = 2Ax, + 1 —0, 








_ — 0 2x, — 0 
et la première de ces équations est en contradiction avec l’équation 
af + x; = (0. k 

En guise de condition de régularité qui garantisse À, = 0, on 
se sert en général de l’indépendance linéaire des dérivées f, (x), — 


+ fm (&) (voir l’assertion 2 du théorème ci-dessus). Néanmoins, 
la vérification de cette condition est souvent plus compliquée que 
la vérification directe, à partir de l'équation (3), du fait que À 
ne peut s’annuler (voir la résolution des problèmes dans le $ 1.6). 
Par conséquent, l’énoncé du théorème donné ci-dessus, sans hypo- 
thèse supplémentaire sauf la différentiabilité, est très commode. 
La démonstration du théorème se base sur un des théorèmes les 
plus importants du calcul différentiel de dimension finie : le théorème 
de la fonction inverse [14, volume 1, p. 4551, [9, volume 1, p. 2591. 
Théorème de la fonction inverse. Soient 
Vu (lus +, Ts + + +, Vs (li, . . ., à) S fonctions de s variables con- 


linûment différentiables dans un certain voisinage du point x. Sup- 
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posons que le jacobien 


diffère de zéro. Il existe alors des no. ëo > 0 et Ü, > 0 tels que 
pour chaque n = (ns, ..., ns), IN | LE, 0n peut trouver un Ë, 
LE 80 tel que V(x HE) —Wp(x) +n et l'on a E— 0 quand 
n — 0. 

Des variantes plus générales de ce théorème seront démontrées 
dans le $ 2.3. 

Démonstration de la méthode des multi- 
plicateurs de Lagrange. Supposons que x est un point 
de minimum local du problème (1). Alors deux cas sont possibles : 
ou bien les vecteurs f! (x), ..., fm (x) sont linéairement dépendants, 
ou ils ne le sont pas. 

A) Supposons que les vecteurs sont linéairement dépendants. 
Alors on peut choisir des nombres he k — 0, 1, ..., m, non tous 
nuls, satisfaisant à la condition (3) par définition. | 

B) Supposons que les vecteurs sont linéairement indépendants. 
Essayons d'obtenir une contradiction avec le fait que x est un mini- 
mum local du problème (1). 

Considérons l'application © (x) = (fo (x) — fo (x), fa (x), ... 
:.., fm (x)). Par hypothèse, les vecteurs f (2), ..., fn (x) sont 
linéairement indépendants, i.e. le rang de la matrice 


0fo (2) . 0fo () 


Ôti ” * Ôôtn 
Hs Léna mas ua 
0fm (x) 0fm (x) 

Où, * ‘‘‘ Otn 


est égal à m + 1. Supposons, pour préciser, que les premières m + 1 
colonnes de la matrice À sont linéairement indépendantes, i.e. 


ôfo (2) dfo (x) 
SE T7 

det i . . SRE S de ge 0. 
0fm (x) OÎm (x) 
0x "tm 


Par conséquent, les fonctions 
Ya (lis + + Tm+1) = 

E fo (1 ee. Tm+is Tm+gs + +.) Tn) — Jo (tr, st Th); 
Vo (x, . Tm+1) = f1 (1, y) Tm+is Tm+as - <<: Th); . 


Ùmn+1 (Ti  . .) Lm+1) = Îm (21 ...) Tmtis mas + +) Tn) 
4—-0237 
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vérifient les hypothèses du théorème de la fonction inverse. D’après 
celui-ci, pour chaque €, 0e <e,, il existe des zx, (E), ... 
., Tm+1 (€) tels que 


fo (a (e), ...) Tm+1 (e), Lm+os « EL Th) ve fo (x) mas 
fa (x (e), +) Lm+1 (e), Tm+2s + - +; Tn) = 0, 
de ro ue ARS a eee 0) 
fm (21 €); + + +, Tm+a (€); Tm+as + + +, En) — 0, 


et l’on à x; (e) + x; pour e +0, i —1, 2, ..., m<+ 1. Mais il 
découle directement de (5) que le point x n’est pas un point de mini- 
mum local. La contradiction cherchée est obtenue. L’assertion 2 
du théorème est évidente. 

La généralisation de la méthode des multiplicateurs de Lagrange 
au cas des problèmes de dimension infinie à égalités et à inégalités 
sera donnée au chapitre IIT. 

Et maintenant encore quelques remarques historiques. La méthode 
des multiplicateurs fut mentionnée pour la première fois dans les 
travaux d’Euler sur les problèmes isopérimétriques (1744). Ensuite 
elle fut énoncée par Lagrange dans sa Mécanique analytique (1788) 
pour une large classe de problèmes du calcul des variations (à savoir, 
pour les problèmes dits de Lagrange, auxquels nous aurons l’occasion 
de revenir). En 1797, dans le livre Théorie des fonctions analytiques, 
Lagrange aborde la question des problèmes de dimension finie À. 

Il écrit: « On peut les réduire à ce principe général. Lorsqu'une 
fonction de plusieurs variables doit être un maximum ou minimum, 
et qu’il y a entre ces variables une ou plusieurs équations, ïl suifira 
d'ajouter à la fonction proposée les fonctions qui doivent être nulles, 
multipliées chacune par une quantité indéterminée, et là chercher 
ensuite le maximum ou minimum comme si les variables étaient 
indépendantes ; les équations qu’on a trouvées, serviront à détermi- 
ner toutes les inconnues. » 

Nous pouvons dire sans trop d’exagération que la plus grande 
partie du présent ouvrage a pour but de clarifier l’idée de Lagrange 
pour l’appliquer à des problèmes de diverses sortes. Exposons ici 
encore une fois l’idée maîtresse de Lagrange. Supposons qu’il faut 
trouver un extrémum pour le problème (1). Alors il faut constituer 


la fonction de Lagrange (2) et envisager le problème Z (x, À, À) — 
— extr sans contraintes. La condition nécessaire dans ce problème 
sans contraintes, d’après le théorème de Fermat pour les fonctions 
à n variables, nous donne les équations nécessaires £, — 0. Aïnsi, 
d’après le principe de Lagrange, les équations pour l’extrémum dans 
le problème à contraintes coïncident avec les équations pour le pro- 


1) Lagrange J. L. Théorie des fonctions analytiques. Paris, 1813, p. 292. 
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blème £ (x, À, À) — extr sans contraintes pour un choix des mul- 
tiplicateurs de Lagrange À, À, approprié. 

Nous verrons par la suite que pour un très grand nombre de pro- 
blèmes l’idée générale de Lagrange s'avère correcte. 


1.3.3. Théorème de Kuhn-Tucker. Dans ce sous-paragraphe, nous 
considérons les problèmes de programmation convexe auxquels l’idée 
de Lagrange s’applique sous sa forme la plus achevée. Cette classe 
de problèmes a suscité l’intérêt des chercheurs assez récemment. Les 
fondements de la théorie de la programmation linéaire (qui est un cas 
particulier de la programmation convexe) furent énoncés dans les 
travaux de Kantorovitch, en 1939. Le théorème de Kuhn-Tucker — 
Je résultat principal du présent paragraphe — fut démontré en 1951. 

Considérons le problème d'’extrémum suivant (le problème de 
programmation convexe) : | 


fo(x) inf, f(@)<0, i=1,...,m, x€EAÀ, (1) 


où À est un espace vectoriel (non nécessairement de dimension 
finie), les j; sont des fonctions convexes sur X et À un sous-ensemble 
convexe de X. Notons, ce qui est essentiel, que (1) est un problème 
de minimisation et non de maximisation. 

Rappelons qu’un ensemble C situé dans l’espace vectoriel est 
dit convexe s’il contient, avec chaque couple de ses points x et y, 
également le segment [xr, y] = {2|[z—= ar +(—a)y, 0<a< 
< 1} tout entier. La fonction f: À — R est dite convexe si pour des x 
et y € À quelconques on a l'inégalité de Jenssen 


J (ax + ( — a) y) Laf(x) + (—a)f(y), Va, 0<La<1, 
ou, ce qui revient au même, si le « surgraphe » de f, i.e. l’ensemble 
epif—= {(& ERXX]|a> f(x) 


est un ensemble convexe dans le produit R X X. 
La fonction 


L=L (x, À, ho) ee à hfn (x), (2) 
OÙ À = (À,, ..., Àm), est appelée fonction de Lagrange du problème 


(1), tandis que les nombres À,, ..., Àn sont les multiplicateurs de 
Lagrange. La contrainte x € À n’a pas trouvé sa place dans l’expres- 
sion (2). 

Théorème de Kuhn-Tucker. 1. Soient: X un 
espace vectoriel, f;: X—R, i — 0, 1, ..., m, des fonctions con- 
vexes sur X et À un sous-ensemble convexe de X. 


Si x est une solution du problème (1), alors il existe des multiplica- 


teurs de Lagrange À. à qui ne s’annulent pas simultanément tels que 
4 
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a) min £ (x, À, À) = L (x, À, À) (principe du minimum); 


xEA 
b) À; >0, i—=0,1,..., m (condition de non-négativité); 
C) Af;(x) = 0,i—=1,2,..., m (condition de non-rigidité com- 
plémentaire). 


2. Si Ro 0, les conditions a) à c) sont suffisantes pour qu'un 
point admissible x soit la solution du problème (1). 

3. Pour avoir à) Æ 0, il suffit de l'existence d’un point x£€A 
vérifiant la condition de Slater: 


fi (@)<0, i=1,...,m. 
Ainsi, si la condition de Slater est remplie, on peut supposer que 


Ào = 1. 
La relation a) reflète la pensée de Lagrange sous sa forme la 


Di 


plus achevée : si x fournit un minimum au problème à contraintes 
(sous forme d’inégalités), ce même point donne un minimum à la 
fonction de Lagrange (dans le problème sans celles des contraintes 
qui sont comprises dans la fonction de Lagrange). Les relations b) 
et c) sont typiques pour les problèmes à à inégalités (pour plus de 
détails, voir $ 3.2). 

La démonstration du théorème de Kuhn-Tucker se base sur un des 
théorèmes fondamentaux de l’analyse convexe: le théorème de sépa- 
ration. Il est vrai qu'ici sa variante la plus simple de dimension 
finie nous sera suffisante, nous allons l’énoncer ; quant à la démons- 
tration, elle sera donnée dans le sous-paragraphe suivant. 

Théorème de séparation en dimension 
finie. Soit C un sous-ensemble convexe de RN qui ne contient pas le 


point 0. On peut alors trouver des nombres a, . . ., an tels que pour 
chaque x = (x, ..., tn) EC on a l'inégalité 

N 

2 a;t; >Ù (3) 


(autrement dit, l’hyperplan D a;x; — Ô passant par OÔ sépare R\ 


en deux parties, l’une éuelles contient entièrement C). 
Démonstration du théorème de Kuhn- 


Tucker. Soit x la solution du problème. Sans perte de généralité, 
on peut supposer que fo (x) = 0: autrement on n’a qu’à introduire 
la fonction $ & = f, (x) — fo (x). Posons 
C= ER, p = (ho, - .., Um) | 1x € A: fo (à) € Lo 

fi (x) Ki, 21). (à 
Le reste de la démonstration est divisé en plusieurs étapes. 
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A) L'ensemble C est non vide et convexe. En effet, chaque vecteur 

u € R7# aux composantes positives appartient à C, puisque dans 
(4) on peut poser x — x. Par conséquent, l’ensemble C est non vide. 
Démontrons qu ‘il est convexe. Soient u — (Los + + +: Um) et U° = 
Um) EC,O0<La<i,zxet zx des éléments de À tels que 


== (Ho, 

(en vertu de ‘a fo (x) < Mo: fo (x) < Lo: f; (x) < Hi; fi (x ) < Mi, 
i > 1. Posons x, — ax + (1 — a) x’. Alors x, € À. puisque n est 
convexe et, d’après la convexité des fonctions f;, on a 


fi (a) = fi (ax + (10) x) < 
<apy+(1—a)m,  i=0, 
Safe + a fe) ET ao A, 


i.e. le point au + (1 — a) u’ appartient à C. 

B) Le point 0 € R"*1 n'appartient pas à C. En effet, si le point 0 
appartenait à C, on en déduirait, d’après la définition (4), l’existence 
d’un élément x € A pour lequel les inégalités suivantes seraient 
satisfaites : fo (x) << 0, f; (x) ZO0,iZ>i. Mais ces inégalités impli- 
quent que x n’est pas une solution du problème. Donc O0é C. 

Puisque C est convexe et 0 é C, on peut appliquer le théorème 
de séparation, d’après lequel il existe des nombres À,, . . ., Àn tels 
que 


2: Âu,; >0 (2) 


quel que soit nu EC. 

C) Les multiplicateurs };, i0, de (5) sont non négatifs. En 
effet, nous avons déjà vu dans A) que tout vecteur à composan- 
tes positives appartient à C, en particulier, C contient le vecteur 


sa he ies rer ee) où e=—0 et { se trouve à la i,-ième place, 
i, > 0. En substituant ce point dans (5), on obtient jee e > Le 
ee. 


d’où l’on tire, & > 0 étant arbitraire, que À, >0. 

D) Les multiplicateurs à;, i>1, vérifient les conditions de 
non-rigidité complémentaire. En effet, si }f; (x) =0, j,>1, l'éga- 
lité hifi (x) —0 est triviale. Supposons que he (x) < 0. Alors le 


point (à, 0, , 0, fi, (x), 0, ..., 0), où le nombre LE (x) est situé 
à la j,-ième place, tandis que Ô > 0, appartient à C: il suffit de 


prendre le point x dans le rôle de x dans (4). 

En substituant ce point dans (5), nous obtenons hifi (x) > —ÀÔ 
et donc, Ô > 0 étant quelconque, l'inégalité hi, O0. Mais a 
avons démontré dans C) que À, >0, donc À; .=0 et À; no (x) — 


LT INTRODUCTION [CH. I 


E) Le point x vérifie le principe du minimum. En effet, supposons 
que x € À. Alors le point (f, (x) + 6, f1 (x), . - ., fm (x)) appartient 
à C pour tout ô => 0 (voir définition (4)). Par conséquent, en se 
servant de (9), on a 


Rofo (x) + 21. hf: G)Z> — Àô. 


D'où l'on tire (ô => 0 étant arbitraire) l'inégalité 
L (x, À, No) > 0. 


Maintenant, si l’on prend en considération l'égalité fo (x) =:0 


et la condition de non-rigidité complémentaire, on obtient, pour 
tout x € À, 


L'’assertion 1 du théorème est démontrée. 
F) Démontrons l’assertion 2. Si l’on admet que À, 0, on peut 


supposer À, — 1 (puisque les multiplicateurs de Lagrange, vérifiant 
les relations a) à c) du théorème, conservent leurs propriétés lorsqu'ils 
sont multipliés par un même facteur positif quelconque). Mais alors 
pour tout x (x € À, f; (x) 0, i > 1) admissible, on obtient 


a 


fo @>f (x) + ÿ hf: (x) = £ (x, À, DES (&, À, 1) — 
1=1 


ie. xest une solution du problème. 

G) Démontrons l’assertion 3. Supposons satisfaite la condition de 
Slater, i.e. pour un certain x € À les inégalités f; (x) < 0, i > 1, sont 
vérifiées, mais néanmoins dans l’assertion À nous avons À; — 0. 
Nous obtenons alors une contradiction immédiate (dans notre calcul, 
nous nous servons du fait que tous les À, i > 1, ne sont pas nuls): 


LG O=Y hf: <0=£(@, À 0), 


tandis que d’autre part a) implique £ (x, À,0) > Z (x, à, 0). ES 

Nous considérerons encore une autre variante du théorème de 
Kuhn-Tucker. Lorsque la condition de Slater À, > Ù est vérifiée, 
on peut supposer, les multiplicateurs de Lagrange étant déterminés 
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à un facteur positif près, que À — 4. Alors la fonction de Lagrange 


L (eh 1) = fo (+ À fi (9) 
est définie sur l’ensemble 
A X RE = AN) IT = 225-458) CAS 
TT et) 
et les relations a) à c) sont équivalentes à l’assertion suivante: 
{x, À) est un point selle de cette fonction, i.e. 


min £(r, À, 1)=£(xr, À, 1)=max£Z (x, À, 1). (6) 
XEA 1>0 


En effet, la première égalité dans (6) coïncide avec a), tandis 
que la deuxième découle de c) et de b): 


LG h = + Dh GR @> 


>fo(©) + Du: G)=£(xr, À, 1). 


Dans les $$ 2.6, 3.1, 3.3, 4.3 nous aurons l’occasion de rencontrer 
d’autres théorèmes d'analyse convexe et de programmation con- 
vexe. 

Remarque. En « analyse convexe », il s'avère commode de 
considérer les fonctions à valeurs dans la droite augmentée R — 
— R U {—o, +}, i.e. il est commode d’admettre que les fonc- 
tions puissent avoir des valeurs infinies —oco, oo. Les règles de 
l’arithmétique se généralisent à cette droite augmentée avec certaines 
réserves (nous en parlerons en détail dans la remarque de 2.6.1). 
On vérifie aisément que la démonstration du théorème de Kuhn- 
Tucker reste valable, sans aucun changement, lorsqu'il s’agit de 
telles fonctions. 


. 1.3.4 Démonstration du théorème de séparation en dimension finie. 
L' énoncé du théorème a été donné ci-dessus. Rappelons que C est un ensemble 


convexe dans RV et 0 C. 

A) Soit lin C l'enveloppe linéaire de l’ensemble C, i.e. le plus petit sous- 
espace vectoriel contenant C. On a ou bien lin C - R\, ou bien lin C = R\. 
Dans le Res cas lin C est un sous-espace propre de RV et il existe donc un 


hyperplan >. a;xz; = 0 qui le contient et passe par l'origine. Ce plan sera le 


i=1 
plan cherché. 


B) Si lin C — R\, alors, parmi les vecteurs qui appartiennent à C, nous 
pouvons choisir N vecteurs linéairement indépendants et formant donc une base 


de R". Désignons-les par &,, ..., ëni & EC, i=1,...,N. 
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Considérons dans RŸ deux cônes convexes : l’« octante négative » 
N ln. "2 
Ha={reR\|z= D fie, B; <O, Eli 34 N} 
i=1 


et l’enveloppe conique de l’ensemble C 


S 
Ai={zER"|r= ÿ die REC, 0, 1=1,::1:86; 2% quelconque}. 


i=1 
ed N ON N 
Ces cônes sont disjoints. En effet, si le vecteur x =— Ÿ Yie;, Y;: > 0, 
i=1 
appartenait à &,, alors on pourrait trouver des s€N, &; > 0 et ê, EC tels 
S 
que x — > &;Ë;. Maïs alors le point O0 appartiendrait à C, puisqu'il se 


i=1 
représente sous forme de combinaison convexe 


CEST N ee 
; D aibit D vie 
0 — > Ci i XL — s N 
a D + D) Vi 
i=1 i=1 


de points appartenant à C. 
C) Puisque &, est ouvert, il découle de B) qu'aucun des points de , ne 


peut appartenir à l’adhérence &’, de l’ensemble ,. (Notons que €, est fermé 
et convexe. Pourquoi?) Considérons un point arbitraire de &Z1, par exemple, 
N 


Lo = — Dé et trouvons le point £, € #, le plus proche. Un tel point existe; 
i=1 

à savoir, c’est celui des points de l’ensemble compact &': NB (x | x l) auquel 

la fonction f (x) = | x — x, | atteint son minimum. 


D) Considérons l’hyperplan H qui passe par &, perpendiculairement à x, — 
— £, et montrons que c’est le plan cherché, i.e. que 0 € H et l’ensemble C est 
contenu entièrement dans un des deux demi-espaces fermés limités par cet hyper- 


. . © . # . 
plan. Nous montrerons même plus, à savoir: si H est l’intérieur de celui des deux 


demi-espaces qui contient le point x,, alors À f &', — @g. Puisque l’ensemble C 
est contenu dans &’,, il est entièrement contenu dans le demi-espace fermé com- 


# Q « 9 
plémentaire à H. 


Re PS 
Supposons le contraire, et soit &, € H N 2. Alors l'angle x6606, est aigu. 
En outre, on a [&,, 61] € 2, puisque 7, est convexe. Abaïissons à partir de x 
sur la droite (£,, &,) la _perpendiculaire (to G2)s Eo € (Ëo E1) et montrons que 
E, n’est pas le point de €’, le plus proche de x,. En effet, les points &,, &, et & 


sont situés sur une même droite et £, € H (pourquoi ?). Si l’on a 6, E [Ëo, El» 
alors &, € d'à et | ro—Éo | <1zo—Ë60l (a perpendiculaire est plus courte que 
l’oblique). Mais si &, se trouve entre &, et £., alors | ro — E1 | << | zo —Ëol (de deux 
droites obliques la plus courte sera celle dont le pied est plus proche du pied de 


la perpendiculaire). 
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D'autre part, H passe par le point 0, car autrement le rayon issu de Ô dans: 
la direction du point &, et entièrement contenu dans &, (pourquoi?) aurait. 


# Q e © 
nécessairement des points communs avec }. 


$ 1.4. Problème élémentaire du calcul des variations classique 
et ses généralisations 


1.4.1. Equation d’Euler. Peu après les travaux de Jean Bernoulli 
sur le brachistochrone, de nombreux nouveaux problèmes du même 
type virent le jour (et furent résolus). Bernoulli proposa à son élève 
Euler de chercher une méthode générale pour les résoudre. 

En 1744, Euler publia son ouvrage Methodus inveniendi lineas: 
curvas maximi minimive proprietate gaudentes sive solutio problematis. 
isoperimetrici latissimo sensu accepti (Méthode pour trouver les courbes: 
qui possèdent des propriétés de maximum ou de minimum, ou la résolu- 
tion du problème isopérimétrique considéré dans son sens le plus large), 
dans lequel il posa les bases théoriques d’une nouvelle branche de- 
l'analyse mathématique. En particulier, en se servant de l’approxi- 
mation des courbes par les lignes brisées, Euler trouva une équation: 
différentielle du second ordre à laquelle doivent satisfaire les extré-- 
males. Par la suite, Lagrange l’appela équation d'Euler. En 1759, le- 
premier travail de Lagrange dans cette direction vit le jour et avec: 
lui des nouvelles méthodes de recherche. Lagrange « fait varier »- 
la courbe susceptible de donner un extrémum, distingue dans les: 
accroissements des fonctionnelles les parties linéaires principales, qu’il 
appelle variations, et se sert du fait qu'aux points d’extrémum la 
variation doit s’annuler. La méthode de Lagrange devint par la suite. 
universelle. C’est à l’aide de cette méthode que nous déduirons dans: 
ce qui suit l'équation d’Euler. Notons également qu'après les travaux 
de Lagrange, Euler proposa d'appeler toute la branche des mathé-- 
matiques à laquelle la méthode de Lagrange était applicable le- 
calcul des variations. 

Passons à la démonstration de l’équation d’Euler pour le problè- 
me élémentaire du calcul des variations classique. C’est ainsi que: 
nous avons appelé, dans 1.2.6, le problème d’extrémum suivant 


1 
J (x(-)) = | L(t,zx,2)dt—extr, x(to) =%xp t(ts)=xs, (1): 
to 
considéré dans l’espace des fonctions à dérivées continues C1 ([£,, t,)). 


—00 Li Lt, L' Ho. L'espace CT([t,, fl) est un espace de: 
Banach, ï.e. c’est un espace normé complet relativement à la norme : 








[x (-) 


,—=max( max [x(t)}|, max Lx (4)1). 
tEEto, t1] 1EEto, t1] 
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Nous supposerons que la fonction ZL (on l’appelle intégrante ou 
lagrangien du problème) est continue relativement à toutes ses 
variables ainsi que ses dérivées partielles L, et Z.. 

X 


Théorème (condition nécessaire d’extré- 
mum pour le problème élémentaire du cal- 
cul des variations classique). Supposons que la 
fonction x (+) € C1 ([to, t1l) donne un extrémum local pour le problème 
(1); alors elle vérifie l'équation 


— F Le (E, z (6), S (D) + Le (é, z(t), 2 (6) =0. (2) 





L'équation (2) est appelée équation d'Euler. La fonction admissible 
x (-) pour laquelle elle est satisfaite est appelée point stationnaire 
du problème (1) ou extrémale. Ainsi les extrémums locaux du problème 
sont des extrémales ; la réciproque est en général fausse. 

Un extrémum local dans l’espace C1 ([é,, £,1) est appelé extrémum 
faible en calcul des variations. D’après les définitions générales, la 
fonction x (-) donne un minimum (maximum) local au problème (1) 
dans l’espace C1 ([6,, t,1) s’il existe un e >> 0 tel que pour toute 
fonction x (+) E CT (to, £,1) vérifiant x (t,) = x (t,) = Oetfx (-)IL< 
< &, on a l'inégalité: 


JTat)+izt)>S GC) (KSG&UO) 


Nous démontrerons le théorème deux fois. D'abord en nous servant 
du raisonnement de Lagrange. Il est vrai qu'il nous faudra alors 


supposer que la fonction t > L. (t, x (t), x (t))est continûment diffé- 
X 


rentiable. Nous démontrerons ensuite l'important lemme de Dubois- 
Raymond, qui implique notre théorème sans hypothèse supplémen- 
taire. Une généralisation de la construction de Dubois-Raymond sera 
essentielle au chapitre IV. 

La démonstration du théorème s'effectue en trois éta- 
pes. 
A) Définition de la première variation 
d'après Lagrange. Soit x (+) E C!([6,, th). Envisageons la 
fonction À +-> (À) = Ÿ (x (+) + Ax (-)). On a 


li li 


eQ)= ŸF( 1) dt= | L(E, (+27 (0, 20 + he (0) dt 


to to 


Les contraintes imposées à L permettent, pour calculer la dérivée 
@ (0), de différentier la fonction F sous le signe de l'intégrale (pour 


cela il suffit que les fonctions (it, D '- Ft, Det (4, À) +—- “ (é, À) 
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soient continues ([6], vol. 2, p. 661 ; [11], vol. 2, p. 107). En calculant 
la dérivée et en substituant À — 0, on obtient 
ti 
g(O)= À (4 () x (+ p (© z (6) dt, (3) 
to 
où 
pO=L.(t st), 2), q(=Li(t, z(, z(i). (82) 
Ainsi la limite lim (J (@()+Ar()— SZ (&(-))/À) existe pour 
0 
toute fonction x(:) EC1([fo, tal). Désignons cette limite par 
ÔJ (æ(:); x(-)). La fonction z(:) > ÔY (x (-) : x (-)) est appelée 
première variation de Lagrange de la fonctionnelle Y. 


B) Transformation de la première varia- 
tion, obtenue en intégrant par parties. Sup- 
posons que æ (t,) = x (t,) = 0 et que la fonction p (-) est continü- 
ment différentiable. D'après Lagrange, on a 


ti t1 


SJ G();2()= (Gr D+POeE)dt-|abztd, 
to to 
où a (t) — _p (t) + q (t) (le produit p (t) x (t) s'annule aux extré- 


mités de l'intervalle d'intégration). 

Nous savons que x (+) donne un extrémum local; pour fixer les 
idées, supposons que c’est un minimum pour le problème (1). Il en 
découle que la fonction À œ (À) possède un minimum local à 
l’origine. D’après le théorème de Fermat (voir 1.3.1), on a @" (0) — 
== ÔŸ (x (+); x (-)) — 0. En comparant ceci avec (4), nous voyons 
que pour une fonction quelconque zx(-+) E CT (lt,, t,l) vérifiant 

1 
æ (to) = x(t,) = 0, on a l'égalité | a (t)x(t) dt = 0. 
to 

C) Lemme fondamental du calcul des va- 
riations classique. (Lemme de Lagrange.) 
Supposons que la fonction continue t > a (t),t € [to, t.l vérifie l'égalité 
11 
| a (t) x (t) dt =0 pour toute fonction x (+) continûment différentia- 


i, 

ble et telle que x (to) = x (t,) = 0. On a alors a (t) = 0. 
Démonstration. Supposons que a (t) 0 dans un certain 

point tT Et, t,l. Puisque a (+) est continue, on peut trouver un 

intervalle fermé À — [rt,, t,] € (t,, t,) sur lequel a (+) ne s’annule 
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pas. Supposons, pour fixer les idées, que a (t) a >0,tE€ A. Cons- 
truisons la fonction 
a (f— ti) (f—T})2, tEA, 
x (t) — 
0, té A. 


On vérifie aisément que x(-) EC! ([tos tal); en outre, x (to) — 
l1 
= x (t) =0. D'après l'hypothèse du lemme, | at) x (t) dt, 


î 
D'autre part, d’après le théorème de la moyenne ([6], vol. 2, 
p. 119; [11], vol. 1, p. 344), on a 


ti l1 
| a (t)x(t) di = a (£) | (dt >0, 
to to 


et cette contradiction démontre le lemme. M 
En comparant ce que nous avons obtenu dans A) et C), nous 


voyons que =D (t) + qg(t) = 0, ce qu'il fallait démontrer. 


D) Lemme de Dubois-Raymond. Supposons que les fonctions 
a (+) et b (+) sont continues sur [to, t.l et que 


ta 
| (a (2) & (#)-+ 0 (&) x (1) dt = 0 45) 
bo 


pour toute fonction x (+) E CT ([to, t1l) est telle que x (to) = x (t5) = 0. Alors 
la fonction a (:) est continûment différentiable et da (t)/dt = b (t). 

Démonstration. En calculant dans (5) l'intégrale du deuxième 
terme b (t) x (t) par parties, on obtient 


li t t 
0 | (a (t) — | b (s) ds) x (t) di + | bas] "= 
to Lo to : 


t1 t 
= | Fe o—| b(s)ds)æ(t)dt. (6) 
to do 
t 
Démontrons que œ (ti) = a (t) — \ b (s) ds = Cte. Si c'était faux, on 


pourrait trouver des 7, et t, tels que u (x) Æ @ (T2). Sans perte de généralité, 
on peut supposer que 7, et t, sont des points intérieurs du segment [t,, t.] et 
P (T1) > p (T2). Choisissons $ > 0 de manière à avoir [t; — 6, 7; se Ô] 
C (to, l, i = 1, 2 et p (s + T;) — eé+r)> a 0 pour |s|< 6. 
Prenons une fonction x (-) dont la dérivée a la forme spéciale suivante 


(t— Ta 0) (f—To—0), 1E[Te —0, Te +], (7) 
O pour les autres té. 


; —(i—7T1 +6) (t—T1 —Ô), 1E[T:—06, Tt, +], 
ol + 
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l1 
Si l’on pose z(t,)—0, on aura d’après (7), :(= | x (t) dt=— 0, de sorte 


lo 
que pour une telle fonction x(-) on doit avoir (6), mais 


li U T1+0 T2 +0 
ffaw—{soa]z:a- | phrbat+ | phzta= 
do | Lo Ti T0 
= [otmto-ptt+)(6-9 (+0 8>e | (6—9(s+8)45>0. 
26 26 


t 
Cette contradiction montre que @ (t) = a (t) — À b (s) ds — Cite; alors a (:) 


t 
est différentiable et da/dt — b. M ° 
En appliquant le lemme de Dubois-Raymond à la première variation (3), 


on obtient p (+) € C1 (te, til) et p (é) = q (6. 

Les raisonnements que nous venons d'effectuer contiennent sous 
forme embryonnaire ce que l’on appelle la méthode des variations, 
méthode qui permet de déduire diverses conditions nécessaires 
d'extrémum. Essentiellement, cette méthode est la suivante. Soit x 
un point susceptible de donner un minimum au problème f (x) — inf, 
x E C. On peut alors essayer de construire une application continue 


kr> x (A), À E R+ de manière à avoir x (0) = x et x(N EC, 0< 
À À. Il est naturel d'appeler cette courbe variation de l’argu- 
ment. Posons p (À) = f (x (À)). Supposons que la fonction est difté- 


rentiable à droite relativement à À. Si x est effectivement un point de 
minimum, on doit avoir l'inégalité œ (+0) — lim (œ (À) — 
140 


@ (0))/A > 0, car, évidemment, o (à) > @ (0) —f (x). Si l’on arriverait 
à construire un ensemble de variations de l’argument suffisamment 
massif, alors la famille des inégalités obtenues @” (+0) > 0, qui se 
rapportent à toutes les variations, nous donnerait une certaine con- 
dition nécessaire de minimum. Pour déduire les équations d’Euler, 
on s’est servi des « variations dans une direction donnée »: x (À) — 
= x + At. Pour obtenir les conditions nécessaires de Weïerstrass et 
le principe du maximum, nous nous servirons de variations d’un 
autre type : les variations dites «en aiguille » (voir 1.4.4 et 1.5.4). 

Pour conclure, notons les deux premières intégrales suivantes de 
l'équation d’Euler : 

1) Si le lagrangien ZL ne dépend pas de x, l'équation d’Euler possè- 
de une intégrale évidente 


_p=L.(E, : &) _. 


Cette intégrale est appelée intégrale de l'impulsion. 
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2) Si le lagrangien Z ne dépend pas de #, l'équation d’Euler possè- 
de la première intégrale suivante 


H (#)= L. (x (+); OO (é) ; : (4)) = Cie. 


On l'appelle intégrale d'énergie (ces deux termes proviennent de la 
mécanique classique; nous aurons encore l’occasion d’y revenir; 
voir 4.4.6 et 4.4.7). Pour la démonstration, calculons la dérivée 


= LG; 20) 20+7 LEO: 20) 70 
— Li (e(t); 2) OL. (0; z())z(0 = 
= (5 LG: 20)—L (20: 2 (0)) z(=0 


d’après l'équation d’Euler. Par conséquent, À (t) = Cte. 
Remarque. Dans ce calcul, nous avons utilisé [° hypothèse 


supplémentaire affirmant l'existence de la deuxième dérivée x (#). 
Cette hypothèse peut être affaiblie, maïs il est impossible de s’en 
passer entièrement. 

Remarquons aussi que l’équation d’Euler est une équation diffé- 
rentielle du second ordre. Son intégrale générale dépend (dans la 
plupart des cas) de deux constantes arbitraires. Leurs valeurs se 
déterminent à partir des conditions aux limites. 


1.4.2. Conditions nécessaires dans le problème de Boltz. Conditions 
de transversalité. Le problème élémentaire envisagé dans le sous- 
paragraphe précédent est un problème à contraintes: les conditions 
aux limites x (to) = Zo, x (t:) = x, nous donnent des contraintes sous 
forme d’égalités. Le problème suivant, appelé problème de Boltz, 
est un problème sans contraintes, Supposons que ZL vérifie les mêmes 
conditions que dans 1.4.1 et soit ! = 1 (x,, x.) une fonction de deux 
variables continâment différentiable. Envisageons le problème 
d’extrémum suivant dans l’espace C1 ([6,, tl): 


l1 
8 (&(-)=\ L(t, x, z)dx+l(x(t), x(ty))—extr. (1) 
to 
C’est ce problème qui est appelé problème de Boltz. 


Théorème (condition nécessaire d’extré- 
mum pour le problème de Boltz). Supposons que la 


fonction x (+) € C1 (Lt, t,1) donne un minimum local pour le problème 
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(1). On a alors l'équation d'Euler 


— 7 Lift 2(, 2(0)+ Lt &(0, z(0)=0 (2) 
et les conditions de transversalité 
# . ol re . 7: 
" À dl (x . 
L, (4, 2(), 2 ()= EE u) (3) 


Démonstration. En raisonnant exactement comme dans 
la première étape de la démonstration du théorème du sous-paragra- 
phe précédent, nous obtenons l'expression suivante pour la première 
variation de la fonctionnelle &: 


ôR (x(-); z(-)) 


+ || 
bi 


= | (GO z()+p (x (8) dt+ ar (to) + mr (4), (4) 

lo 
où p(-) et g(:) se déterminent par les relations (3a) du sous- 
OH} EN; Lg 4. 


paragraphe précédent, tandis que «;,— Ta 
t 


Puisque x (.) est un point de minimum local, on a Ô& (x (-) : 
z(:))=0 pour chaque x(:) EC! ([to, t1]). En particulier, Ô8 (x (-); 
t(-)) =0 quel que soit (+) EC! ([éo, tal) vérifiant x (£&) = zx (#1) = 0. 
D'après le lemme de Dubois-Raymond, la fonction p(-) est con- 
tinûment différentiable, et l’on a PO LG (6). En intégrant dans 


(4) par parties et en nous servant de l'égalité p (£) = q (t), nous obte- 
nons l’expression suivante pour la première variation de Lagrange 
de la fonctionnelle de Boltz: 


068 (x(-); x(-))— 
lt 
_ | (q (&) — p (t)) x () dt + (ao — p (to)) & (to) + 


to 


+ (&i+ p(t))z(ts) = (Go —p (bo) (to) + (+ p(é))z(t). (5) 


Si l’on pose successivement x (ft) — t — t, et ensuite t — t, dans 
(6), on obtient &, = p (to), —@1 = p (t1). M 

Ainsi nous avons à nouveau obtenu une équation du second ordre 
et deux conditions aux limites: les conditions de transversalité. 
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Ci-dessus nous avons considéré le problème de Boltz en dimen- 
sion 4. D’une manière tout à fait analogue, on pose le problème 
vectoriel 

l1 
B(a())= À L(, m0... œn do... an) dt+ 
to 


+ L'(ta (bo), .., Æn (to), La (da), -.., Tn (é1)) — extr, (1°) 


L'RXRTX RT=R, 1: R?7X RT—=R. 


Les conditions nécessaires d’extrémum sont ici également de la 
forme (2), (3), sauf que les équations correspondantes doivent être 
envisagées comme des équations vectorielles : 


+ Le (ti, (4), ..., En (6), 2 (Ë), ..., En (É)) + 
J 


EL te 0 A0) mr 0)=0, 0 


Le (Gi T4 (é;), ...) Th (£;), T1 (;), 293 Ta (t:)) = 
J 


ee (— 1) ô1 (x: (£o): .….., Zn Gi # (&1), ...) Zn (t1)) (3’) 


LOTS Jeu 


1.4.3. Généralisation du problème élémentaire. Le problème 
élémentaire du calcul des variations classique avait été envisagé 
dans 1.4.1 dans l’espace CT ([6,, t.1). Ceci est une concession à l’usage 
traditionnel. L'espace CT ([é,, t.]) est évidemment commode, mais 
il est loin d’être naturel pour tous les problèmes. En particulier, sous 
les hypothèses relativement à l’intégrante (continuité de L, L,, L. 


par rapport au système de variables (é, x, 2)), l’existence de la solu- 
tion dans l’espace C1 ([6,, #1) n’est pas toujours garantie. Considérons 
un des exemples les plus simples. 

Exemple de Hilbert. Considérons le problème 


1 
T@C)= |: PB dt inf, æx(0)=0, æx(1)— 
0 
Ici l’équation d'Euler possède l'intégrale de l'impulsion (voir 
1.4.1) suivante : #l8x — C, d'où l’on tire que l'unique extrémale 


admissible est x (&) — 148, Cette extrémale n'appartient pas à l’espace 
CT (to, t1]) (pourquoi ?). Néanmoins, elle nous donne le minimum 
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absolu dans le problème envisagé. En effet, supposons que x (:) 
est une fonction absolument continue quelconque !) pour laquelle 
l’intégrale Ÿ (x (-+)) est finie et x (0) — x (1) — 0. Alors 


JG CD+2 (= | PP (Ge (0 +25 (0 2 (9 +22 (0) at = 


] 
Er 


1 
= 3 (C++ | r0 +3 RC)=3 EO)+I6CD>IEO). 
0 


Ainsi la solution du problème existe, mais n’appartient pas à 
l’espace CT ([to, til). 

Parmi les célèbres problèmes de Hilbert, certains se rapportent 
au calcul des variations. En particulier, dans le vingtième pro- 
blème, il s’agit de l'existence des solutions. Hilbert écrit 2): « Je 
suis convaincu que ces démonstrations d'existence peuvent être 
effectuées à l’aide d’une méthode fondamentale générale, indiquée 
par le principe de Dirichlet, et qui, sans doute, nous approchera de 
la question d’existence de la solution d’un problème variationnel 
régulier quelconque, à condition toutefois d'élargir l'interprétation 
de la notion de solution elle-même. » L'’optimisme de Hilbert se 
fonde sur l’énorme expérience acquise par l'analyse classique. Ici 
nous nous arrêterons brièvement au problème de l'interprétation 
élargie de la notion de solution en prenant l'exemple du problème 
élémentaire du calcul des variations. 

Une des constructions utiles à cet élargissement consiste à ajouter 
à la classe originale d'éléments admissibles de nouveaux éléments 
et de définir la fonctionnelle en question sur ceux-ci. Nous effectue- 
rons dans cette direction un trajet modeste: nous élargirons le 
problème élémentaire à la classe des fonctions différentiables par 
morceaux. 

Rappelons qu’une fonction différentiable par morceaux sur 
[to, 4.1 est une fonction x (+) qui possède la propriété suivante: elle 
est elle-même continue, tandis que sa dérivée est continue par mor- 
ceaux, i.e. continue partout sur [£,, £,l, à l’exception d’un nombre 
fini de points {5 << T1 <... << Tm < t1, et en chacun des points 


T; la dérivée x (+) possède des discontinuités de première espèce. 





1) Les fonctions absolument continues seront considérées dans 2.1.8. Le 
lecteur qui n'est pas familier avec cette notion peut supposer que x (-) est con- 
tinue, continüment dérivable dans le demi-intervalle (0, 1] et possède une inté- 
grale finie {/(x (-+)) (entendue dans le sens impropre) et x (0) = x (1) = 0 


2) Problèmes de Hilbert (édités par P.S. Alexandrov), Moscou, Editions 
Naouka, 1969, p. 55. | 


5—0237 
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Par exemple, la fonction 
0, —1<E<0, 
ne 


t? sin _ 9 0 <t, 
possède une dérivée qui n’est pas continue par morceaux. L'ensemble 
de toutes les fonctions différentiables par morceaux sur [to, ti} 
sera désigné par ÆXCT((é,, til). 
La fonctionnelle intégrale 
t 
JaC)= (LE 26, z (0) dt (1) 
s 10 
(comparer à 1.4.1) se prolonge naturellement aux éléments x (-) € 
E KC1 (to, t11), puisque pour de telles fonctions x (+) l'expression 
sous le signe de l'intégrale est une fonction continue par morceaux 


et l'intégrale existe. 
Envisageons maintenant le problème élémentaire 


J'(c())—extr, x(fo) = Xe x (h) = x (2) 


dans l’espace XC1 ([#,, t,l). A la fin du présent sous-paragraphe, 
nous montrerons un exemple d’une fonction ZL qui vérifie les con- 
ditions standards, pour laquelle le problème (2) n’a pas de solution 
dans l’espace C1 ([é,, 1,1) mais en possède une dans XC ([£,, t.l), de 
sorte que l'élargissement effectué du problème s'avère raisonnable 
(quoique dans l’exemple de Hilbert, le minimum ne s’atteigne pas 
dans XCT non plus). 

I1 faut être un peu plus précis avec la notion de solution locale. 
Si nous continuons à inclure, dans les voisinages de l'élément 


x (+) E KCT ([t,, til), les fonctions x (+) telles que les différences 
z(t)— x (t), de même que leurs dérivées, soient petites (voir la 
définition d’un extrémum faible dans 1.4.1), alors les éléments sup- 
plémentaires seront situés loin des anciens éléments. En effet, si la 


dérivée x (+) possède en un certain point une discontinuité de gran- 
deur 6, aucune des fonctions x (+) E C?([é,, t.,l) ne peut vérifier 


l'inégalité | x (4) — x (t) | < 8/2 pour tous les t (pour lesquels x (t) 
existe). En fait, ceci n’est pas commode: en règle générale, on vou- 
drait que l’ancien espace soit partout dense dans l’espace élargi. 
Par conséquent, nous considérerons les fonctions proches de 
KC1 ([t,, t1l) lorsque les fonctions elles-mêmes sont proches, sans 
prêter attention à leurs dérivées. Ceci nous amène à remplacer la 
notion. d’extrémum faible (voir 1.4.1) par celle d’extrémum fort. 
Définition. La fonction x(-) € KC1([to, til) fournit un 
minimum (maximum) fort au problème (2), s’il existe un & >> 0 tel que 
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pour chaque x (+) € KCT ([t,, t,l) vérifiant x (t,) = zo, t (t1) = M et 


DOTOI ESC Ir (Ü—z (1 <e, (3) 


on a l'inégalité J (x(-) > 3 (x (-)) (9 (z(-))). 
Lemme d'arrondissement des angles. 1) Si 
la fonction L = L (t, x, z) est continue (comme fonction de (t, x, x)), 
alors 
inf ÿ (x(-)) = infZ (x(-)). (4) 


x(-)EKC1([to, t1]) x(-)EC1([to, t1]}) 
X(to)=Xo, X(t1)=X1 X(to)=Xo, X(t1)—X1 


2) L'inégalité (4) reste valable si l’on prend seulement les fonctions 
x (+) E KCT (It, t1l) qui vérifient les inégalités (3) pour les x (+) et 
g >> 0 donnés. 

3) L’assertion reste vraie si l’on remplace inf par sup. 

Démonstration. Puisque KC1 ([6,, t,1) = C1([6,, til), le 
premier membre de (4) n’est pas supérieur au deuxième et il suffit 
de démontrer l'inégalité inverse. Admettons le contraire. Si 


inf YJ (x(-)) inf F (x (-)), on peut trouver une fonction x (-) 
KC1 C1 


différentiable par morceaux et un n>0 tels que 4 (x (-)) < 
< inf Ÿ (x (-)) — n. Soient 7Tt,, i — 1, 2, ..., m, les points où la 
C1 


dérivée x est discontinue et À; = zx (x; + 0) — x (rt; — 0) ses dis- 
continuités en ces points. 
Sur l’ensemble fermé borné 


At, à, 2 SIL, tt; [r—7 (| 


< max |A;,| 6/4, Ix—7 (1) < max |A;[/2} 


la fonction continue Z est bornée: |L (t, x, 2) | LM. 
La fonction 


Ge 
——— , l<i, 
«= 3 AIS 





(9) 

0, él > 1, 
est continue et sa dérivée, pour t — 0, possède une discontinuité 
de grandeur —1. Par conséquent, la fonction 8a +) , dont le 


graphique s'obtient du graphique de a (+) par similitude et trans- 
lation (fig. 22), est également continue et sa dérivée est continue 
partout sauf au point v;, où elle possède toujours une discontinuité 
de grandeur —1. 


5* 
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On vérifie maintenant sans difficulté que la fonction 


Ts H=6+S Aiôa (-—*-) 


i=1 


est continue avec sa dérivée sur [é,, filet l’on a xs (6) = x (t) en 
dehors des segments [t; — 6, t;, + ô]. En particulier, pour Ô suffi- 
samment petit, ces segments sont disjoints, æs (4;) —.x (t;) — x;, 


Fig. 22 


i—0, 1, et [25 (#) — 2 (#1 max | A; | 0/4, 126 (9 — 2 (D | < 


< max | À; |/2, car d’après (5) on a Ja (t) | < 1/4, |a(t)| ue 
Ainsi, pour ‘0 <ô<ô, on a 


J (C3 EC)= 


l1 


= | L(E (0, a @a [Le 2 (0, #(0) dt 
É m Tit+Ÿ : 
ss | (LE, 2), &(D)—L(E, (8, (6) dt 
i=17T;-ù 


‘et par conséquent 


J (m5 CEST (EC) + AMBM < 
<infJ (x ())—n+4môM < inf J (x(-)), 


si Ô est suffisamment petit. Puisque x; (+) € CT ([t,, #11), nous avons 
obtenu une contradiction. Pour des Ô suffisamment petits, la fonc- 


tion xs (+) vérifie les inégalités (3) si la fonction x (+) les vérifie. 
D'où l’on obtient la deuxième assertion du lemme. La troisième 
est évidente. 

Corollaire. Si la fonction x (+) € C1([#,, til) fournit dans 
Je De (2) un minimum (maximum) absolu ou fort dans l’espace 
C1 (l to, 1l), alors elle possède la même propriété dans l'espace 
KC! (Léo, til). 

L’élargissement de l’espace que nous venons d'effectuer n’est 
pas toujours suffisant. En outre, l’espace ÆXCT ([£,, #,1) n’est pas 
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complet (relativement à la métrique définie par le premier membre 
de (3)). Il serait plus naturel d'élargir le problème à la classe 
W£ (lo t1l) des fonctions qui vérifient la condition de Lipschitz ?). 
Mais ceci nécessiterait des informations supplémentaires provenant 
de la théorie des fonctions. Il y a aussi une autre construction im- 
portante d’élargissement du pro- 
blème élémentaire que nous discu- 
terons ici sur un exemple. 
Exemple de Boltz. 
Considérons le problème 
: | 


JC) = | (A —22)2+ 2?) dt inf, 





z (0) —0, TZ (1) =E, 


Supposons que £ — 0. Il est 
alors clair que le problème n'a 
pas de solution. En effet, la borne inférieure de la fonctionnelle est 
nulle. Pour le comprendre, il suffit de considérer la suite de fonctions 
minimisantes appartenant à ÆCT([0, 11): 


Fig. 23 


t 
Zn () = | signsin2n2""itdr, n—1, 2,... (fig. 23). 
0 


Les fonctions x, (-) tendent uniformément vers 2650 et 2 (t)= 1, 
sauf pour un nombre fini de points, i.e. 4 (x, (-)) — | x, (té) dt + 0. 
D'autre part, si T(-)= 0, on à J(tæ(-)—1, tandis que si 
z(-)Æ0, on a Y (> | a2 dt > 0. 

0 


C’est que la fonctionnelle 4 n’est pas semi-continue par en bas: 
nous avons établi que dans tout voisinage de la fonction x, (+) = 0, 
où la fonctionnelle prend la valeur 1, il y a des fonctions où la valeur 
de la fonctionnelle est considérablement plus petite (Ÿ (x, (+)) — 0). 
Ainsi, un élargissement « semi-continu par en bas » du problème est 
possible : on y remplace la fonctionnelle Z par la fonctionnelle 


ÿ @C)= lim J(y()). 
yC-)-x(:) 


1) Remarquons toutefois que même cet élargissement ne nous donne pas 
l'existence dans l'exemple de Hilbert : la fonction t+ 11/3 ne satisfait pas 
à la condition de Lipschitz. 
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tandis que l’ensemble des fonctions envisagées au début (mettons, 
CT ([to, 411) ou ÆCT ([t,, t1l)) reste le même. Le passage à la limite 
y (-)— zx (-) est considéré ici dans l'espace C' ([é,, #11) (i.e. dans le 
sens de la convergence uniforme). Il s’avère que la fonctionnelle # 
possède une description simple. Dans l’exemple de Raltz 


1 


FC) = | (2-04 + 22) di, 


© 


Dans le cas général, où 
A1 : 
J(&(-))= | L(t, x, 2)dt, 


to 
# (x (+) — | Lit, x, t)dt, 


avec L la « convexisation » de Z relativement à «x, i.e. la fonction 
z—È (Eu 2) est la plus grande fonction convexe qui n’est pas 


supérieure à la fonction z—+ L (CT, 2). Cette assertion s’appelle 
théorème de Bogolioubov. 

Ce même exemple de Boltz peut être employé pour construire 
une variante du problème (2) dans laquelle le minimum est atteint 
Sur une courbe possédant un angle. Toutefois, pour des raisons pure- 
ment techniques, nous considérerons un autre problème: 


lt 


JeC)=T(F@+a)dt-int, z)=2m 2(E)=zs (6) 
to 
où la fonction 
(u— 12, u>i, 
fa)=((u—09= 40 lu<t, 
(u + 1}?, u< nee. 1, 
possède une dérivée continue, tout en étant convexe (fig. 24). 


En particulier, le graphique de f (u) ne peut être situé plus bas 
qu'aucune de ses tangentes, i.e. on a toujours 


f(v) > f (u) + f' (u) (& — u). 
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Par conséquent, pour deux fonctions quelconques æ (+), t(-)€ 
€ KCT([to, til) qui vérifient les conditions aux limites données 


f(u) 
gs | 0 1 u 
Fig. 24 
(x) = 2 (4) = x, i=0, 1), on a 
JS &(-)—F(&())= 
li È : 
= | GG) (0) +2 (0 —2 (0) > 
to 


tt e s 


> | FE) (CE —2 (0) +22 (0 (6 (D — 20) + (20 —2(0)9 > 


to 


1 . . 
> À (EE (070) +22 (0 (2 (0 —2 (0) dt. 
to 


Supposons maintenant que x (+), en tous ses points de différentiabili- 
té, vérifie l’équation d’Euler 


jf (G()= 27 (6). (7) 


En intégrant par parties sur chaque segment où x(-) est conti- 
nue, on obtient 


J(z(-)—3 GC)> 
1 e 
>|(-5f 6 0)+20)E(E—2(0)d+ 


to 


+ DL (Ur +0) —f' (mi —0)) (x (1) — 2 (r)) = 0, 


si, en plus de (7), la fonction p (t) = f’ œ (£)) (l’impulsion) est con- 


tinue. Ainsi, la fonction x (+) vérifiant l'équation d’Euler, la con- 
q 
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dition de continuité de p (-) et les conditions aux limites est une 


solution du problème (6). Par exemple, x (t) = elt, avec un angle 
au point { — 0, est une solution de ce problème pour #, = —1, 
lt = 1, xo = % —e. En effet, 


2 et, 1>0, 


d'où |[z(#)|>1 et donc la fonction | 
: 2(et—1), t>0, 
OPACOE EEE en 
n’a pas de cassure au point £—0: p(+0)=—p(—0)—0. En outre 
_ p(t)=2ell— 2x(t), de sorte que l’équation d’Euler est vérifiée. 


1.4.4. Variations en aiguille. Condition de Weierstrass. La notion 
d’extrémum fort fut introduite dans le calcul des variations par 





a) 
Fig. 25 
Weierstrass. Pour démontrer la nécessité de la condition de minimum 


fort, Weierstrass se servait de variations spéciales de la forme sui- 
vante (fig. 25, a): 


EA + (t—7T) à tE[T—À, T]; 
FER o= | Eu (t—TDEVR tete + VA 


à (1) 
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La dérivée de la variation h, (-) est de la forme indiquée sur la 
figure 25, b. Cette dérivée rappelle quelque peu une aiguille et c’est 
pour cela que ces variations sont dites « en aiguille ». Les variations. 
en aiguille sont très commodes pour l’étude des problèmes d’extré- 
mum fort. 

Passons à la démonstration de la condition nécessaire de Weïer- 
strass. Considérons le problème élémentaire du calcul des variations 
classique 

li 
Ja(C)=|L(E x Ddt-inf, e()=mw z()=m (2) 

to 
sur la classe XCT ([t,, t.,1) des fonctions différentiables par morceaux. 
Supposons que x (-) est une extrémale susceptible de donner un 
minimum fort; pour simplifier, supposons qu'elle est différentiable. 

En suivant la méthode générale des variations, envisageons la 
fonction 

PA) = TJ (a C) = TJ (6) + C0), (3) 
où À, est déterminée par les formules (1), & est un point intérieur 
de [t, 1] et £ un nombre arbitraire. 

Pour des À > 0 suffisamment petits, la fonction x (-) est admis- 
sible pour le problème (2), i.e. x; (t;) = æ(t;) + ha (t;) = x, 
Le 0, À. 

La fonction œ (-) est également définie pour À non négatif. Démontrons 
qu'elle est différentiable à droite au point zéro. Il découle immédiatement de la 
définition ({) que 

a) NA()l= max [hk(G)I=0(, 

Eftos t1] (4) 

b) JA G)I=EVA=O(VR), 1€ (Tr, T+ Va). 

D'où l’on tire 
T ps : 

php O= | (LE 20, 2()+D—L(, 20, 20)a+ 

T-À 

T+VA : 
+ [etat 20-2620, 20)a4-7+r 6 

T 

On peut estimer l'intégrale 7, dans (5) de la manière suivante: 


HR (L(T, 20), 2 (M+E)—L(T, &(r), z(5)))+o(à) (6} 


(il faut se servir du théorème de la moyenne du calcul différentiel classique, 


voir 2.2.3, et de la relation (4a)). ne: 
Pour estimer la deuxième intégrale %,, représentons la différence 


A=L(t, z(t)+h(t), 2()+h(t)—L(E, z(t), x (6) 


74 INTRODUCTION [CE. 1 





sous la forme 
A=Ly(t, 2(t), 2(t)h G)+L. (e, & (1), z(D) ha (+0 (VA) 


(là aussi il faut appliquer le même théorème et la relation (4b)); intégrons le 
deuxième terme par parties et servons-nous du fait que 


d 
Lt = 0 


; x (t) 
(puisque x (+) est une extrémale). On obtient donc 
: t+VA 
Fa=—EL, (2 (0, 20)+ | (ha 


T 
= —EAL, (r, z(t), 2(t))+o(Me (7) 
En comparant (6) et (7), on trouve 
p—p(O=R(L(T, 2 (r), 2 (T)+E)— 
—L(r, 200, 2(D)—EL, (r, (0, 20@)+0(.  (E) 
Ainsi, la fonction œ (+) possède une dérivée à droite au point À = 0: 


=L(t, st), 2(t)+E)—L(x, (0, 2 (D)—EL, (r, (T, æ(r). 


Mais si x (+) fournit un minimum fort, on a Y (x1 (-) > 3 (x (+) 
et donc 


9° (4-0) = lim (p (9 (OA >0, 
1.e. on a la relation 
£ (m2, 0, 20 +9 = 
= L(r, Ê(0, 2(0+9—L (6, 200, 200) 
EL, (r, (0, 2020 


pour tout EE R et tout tv E [é, til; cette relation s'élargit à T — 
— [t,, t,] par continuité. La fonction 

6 (6, LT, y, z) = L (4, T; z) — L (4, La y) — (2 — y) L, (, À, y) 
est appelée fonction de Weierstrass. 
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Aïnsi nous avons démontré le théorème suivant: 

Théorème (condition nécessaire de Weier- 
strass pour un minimum fort). Pour que l'extré- 
male x (+) E C1([éo, t1l) dans le problème élémentaire du calcul des 
variations classique (2) fournisse un minimum fort, il est nécessaire 
que pour tout TE ts, ti] et tout EE R on aie l'inégalité 


e 
mn #= 


B(r, &(r), z(0, (+5 =L(r, z(1), 2(T) +5 — 
—L{r, 2), z(n)—EL.(r z(r), 2(0)2>0. 
1.4.5. Problème isopérimétrique et problème aux dérivées d’ordres 


supérieurs. On appelle généralement problème isopérimétrique (à ex- 
trémités fixes) dans le calcul des variations le problème suivant 


1 
Jo(x(-)) = { fo, æ; 2) dt — extr, 

ü (1 
J@C)= |A, x, z)dt=@;, i—=1,...,m, 

to 


Z (to) = Toy TL (t1) — Tic 


On suppose que les fonctions f; vérifient les mêmes conditions 
que Z dans 1.4.1: ces fonctions elles-mêmes et leurs dérivées par- 
tielles relativement à x et x sont continues. Pour simplifier, envisa- 
geons le cas m = 1. 

Théorème (condition nécessaire d'extré- 
mum pour le problème isopérimétrique) 
Supposons que la fonction x (-) fournit un extrémum local (dans l'espace 
C1 ([to, t1l)) pour le problème 


1 


Jo (t(-)) = | fo (t, æ; 2) dt — extr, 
to 
1 
HeC)= TA x ddt=a, z()=2, i=0,4 (41) 
to 


tandis que les fonctions t —- Î« (6, z (£), x (t)) et ir Î,: (é, z(?), 


z(t)) appartiennent à C'([£o, til). IT existe alors des nombres À. hi 
qui ne s’annulent pas simultanément et tels que pour l’intégrante 
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Le r on aie l'équation d'Euler 


D 1.20, 2@)+L2( 20 20)-0  @ 


Démonstration. A) De même que nous l’avons fait au 
début de la démonstration du théorème dans 1.4.1, calculons les 
premières variations des fonctionnelles 4, et {, suivant Lagrange: 


l1 
SJ): 2()= | (Or +m brad, i=0,1, 


A to 


ou 


pr(=f. (6, 20, 20), q=fi( 2), 2(0). 


L'une des deux possibilités suivantes peut arriver: ou bien 
T1 =0, Vzr(-) E CT (Lo, dl), x (to) = x (t,) = 0, ou bien 07, = 0. 
Dans le premier cas, d’après le théorème de 1.4.1, on a 


fe 2(0), 2 (0) + fie (6 2 (0), (8) —(0), 


en posant À —0, À —1, on obtient immédiatement (2). 
B) Supposons que 9, Æ 0; il existe donc une fonction 


y (-) Ê C? (Lo; til), y (Lo) — ÿ (t) 7 0, 


pour laquelle la variation ôY, (x (-); y (-)) n’est pas nulle. Envisa- 
geons les fonctions de deux variables 


pue, B)=dJi(x(-)+ar(.)+By(-)), i=0, 1, 


en laissant au lecteur le soin de vérifier qu'elles sont continûment 
différentiables dans un voisinage de zéro et que de plus 


ôqi (0, 0) _ Le 
—3n = ÊdJi(r(-); æ(-)), 
RD = 59 (2 (-)3 y (+). 


Lemme. Pour toute x(-+)E CT(lt,, tl) vérifiant x (t,) = 
= x(t;) = 0, on a 








0P 0®o 
ô4 * 9 
0 (er D) (0, 0) — : . = 
1 1 


9 (æ, f) 








24 * 68 {(0, 0) 
ôYo (x (-); z(-)), 8J,(x(-);: y (-)) 0: (4) 
6x.) c(-),  Éda(æ(-):y(-) 
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Démonstration. Si le déterminant dans (4) n’est pas 
nul, l'application (œ, B) > (ps (x, B), p1 (&, B)) envoie un certain 
voisinage du point (0, O) sur un certain voisinage du point (4 (0, O), 
4 (0, 0)) (nous nous sommes déjà servis du théorème approprié sur 
les applications inverses dans 1.3.2). En particulier, on peut trouver 


des æ, B et donc une fonction admissible x (+) + ox (+) + By (:) 
tels que 

Po(a, B) = Jo (-)+ax(-)+ By (-) = Jo (a(-))—8; 
où e > 0, tandis que op, (&, B) = pp, (0, 0) = Y, (x (-)) = où. Ceci 


contredit le fait que x (+) fournit un minimum local au problème (1). 
C) Il découle de l'égalité (4) que 


SJ (&(-); e(-)—SREOIIO) sy, ((); &(-)—0 
61e (C)3 y) 


{le dénominateur est ici non nul par hypothèse). En posant 
# Led AR # 
ko, ÀA1= —0J9(x(-); y (-))8T (x); y (-)), 
nous voyons que 
ho (&(-); 2) + MT: (+); 2(-) = 0 (5) 


pour toute x (+) E CL (lé, #1) vérifiant x (é,) = x (t,) = 0. 
On voit facilement que le premier membre de (5) est de la forme 


t1 


À (hoPo (6) + Aus (0) & (0) + (logo (6) + Aug (#)) & (6) dt. 


ta 


En appliquant le lemme fondamental du calcul des variations, nous 
obtenons l'équation 


ne _ (ÂoPo (&) + lip: (&)) + (0% (6) + higi (&)) = 0 


qui coïncide avec (2). 

Le problème (1”) fut tout d’abord envisagé par Euler dans son 
célèbre mémoire de 1744. Dans ce même ouvrage, il se servit de la 
méthode des lignes brisées pour obtenir la relation (2). À vrai dire, 
ce fut là la principale réalisation de cet article. Sans aucun doute 
il contenait déjà les débuts de la méthode des multiplicateurs de 
Lagrange. 
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Pour conclure, passons en revue rapidement le problème aux 
dérivées d'ordres supérieurs : 


1 
J (œ(-))— | f (£, LT, TX, L, ..., 20) dt —+ extr, 


lo 


a (6)=at, i=0,1, j—=0,...,n—1. 


Pour les détails, nous renvoyons le lecteur à [1] et [7]. Ce problème 
sera envisagé ici dans l'espace C" ([é,, 1,1) des fonctions continues 
avec toutes leurs dérivées jusqu’à l’ordre n sur le segment [é,, til. 


La fonction jf et ses dérivées relativement à zx, x, ..., x") seront 


supposées continues. Soit x (-) une fonction susceptible de donner un 
extrémum. Calculons la première variation de la fonctionnelle selon: 
Lagrange 


t1 


ST ((-); z( = { (> pa (0) 20) (#)) dé, (7) 


to j=0 





(&, (8), ..., a (b)). 


() 
P;(t)= 30) 

Il découle de la condition d’extrémalité locale que ôY (x (-); 
x (-)) = 0 lorsqu'on a 20) (4) =0,i=0,1,j=0,1,...,n—1 
Calculant l’intégrale de (7) par parties (nous laissons au lecteur le 
soin d’énoncer les conditions nécessaires sur la différentiabilité de 
p; (-)), nous mettrons la première variation sous la forme 


89 (æ(-); 2()= (D (18 6) 26 à 
fn  j=0 


et, en appliquant la. généralisation du lemme fondamental du calcul 
des variations classique au cas des fonctions appartenant à C" (Léo, t11} 
et vérifiant les conditions x) (t;) —0, i—0,1,j=0,1,...,n—îÎ 
(là encore nous laissons au lecteur le soin d’énoncer cette généralisa- 
tion), nous voyons qu'une condition nécessaire d’'extrémum pour 


x (+) est l'équation suivante, appelée équation d'Euler-Poisson, 





D 1) (LE) LL €, 20, 20, 20 = 
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$ 1.5. Problème de Lagrange et problème fondamental 
de commande optimale 


1.5.1. Position des problèmes. Une étape importante dans l’histoi- 
re des sciences naturelles fut l'ouvrage de Lagrange Mécanique 
analytique, publié en 1788. En particulier, le traité de Lagrange joua 
un rôle exceptionnel dans le développement du calcul des variations. 
C'est dans ce livre que fut posé le problème d’extrémum lié suivant: 


1 
J (æ(-) = | ft, x), (Ë) dt + extr, (4} 
to 
Dé, rt), z() = 0e D(t, x (t), x (t)) = 0, 
Ft s:s | (2) 


Z (to) = Los ZE (li) = Ti. 


Ici æ(-): Léo, 4] R7, jf: RX RX RT=R, D: RX R?7X 
X R°®— R7. Le problème (1) et plusieurs de ses modifications, qui 
se rapportent à des contraintes supplémentaires (d’autres conditions 
aux limites, des relations intégrales supplémentaires, etc.; voir 
également 1.2.6), furent appelés par la suite problème de Lagrange. 
Pour résoudre le problème (1), Lagrange se servait de la méthode 
fondamentale dont nous avons parlé dans 1.3.2: la méthode des 
multiplicateurs. D'ailleurs, il n'avait jamais démontré rigoureuse- 
ment la validité de sa méthode et il fallut attendre plus de cent ans 
pour que les raisonnements de Lagrange acquièrent la forme d'un 
théorème rigoureusement démontré. | 

Notons deux types particuliers de contraintes les plus importants, 
compris dans l’expression générale (2). La contrainte ® (#, x) = 0, 


lorsque la fonction dans (2) ne dépend pas de x, est appelée contrainte 
de phase dans le calcul des variations. En mécanique, les contraintes 
de phase sont également appelées contraintes holonomes. 

L'autre cas est celui où les relations (2) peuvent être résolues 


relativement aux dérivées x. Dans ce cas, on écrit les contraintes. 
correspondantes sous forme d'équations 


z=œplt,zx,u), æ(-): [t, tl— R?, 
u (+): Léo, él R7, oo: R X R° X R'— R?. 2 


On appelle alors les variables x (+) variables de phase, et les variables 
u (-) variables de commande. Nous prêterons une attention particu- 
lière à ce cas très important. Plus exactement, nous envisagerons le 
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problème 
J (æ(-), u(-)) = 
= | f(, æ(t), u(t) dit (r(éo): sé) —+extr, (1°) 
to 


z—qlt,z, u)=0, v(x(t), x(t)) — 
=0(æ (ft), z(4) 0, j—=1,...,5. (2) 


Ici, dans (1”), 2”), f:V—R, po: V—+ R7, 4%»: W— R°, où V et W 
sont des ensembles ouverts dans les espaces R X R7 X R' et R7 x 
X R’” respectivement. Les instants {, et t, seront supposés fixes. 


La contrainte x — œ (ét, x, u) = 0 est appelée contrainte diffé- 
rentielle, les contraintes, d (x (£), x (t,)) — 0 sont appelées con- 
ditions aux limites ou de bord. Le problème (1’), (2’) sera appelé 
problème de Lagrange sous la forme de Pontriaguine. 

Toutes les fonctions f, æ et 1 sont supposées continûment diffé- 
rentiables. 

Par la suite (dans le chapitre IV) nous considérerons un cas encore 
plus général où t, et t, peuvent également varier, des contraintes 
isopérimétriques sous forme d’égalités, d’inégalités sont ajoutées, etc. 

Le problème (1’)}, (2”) sera considéré dans l’espace de Banach 
Z = C1, t,l, R7) X C (Léo, 11, R7). Autrement dit, nous considére- 
rons les paires (x (+), u (-)), où x (+) est une fonction vectorielle conti- 
nûment différentiable de dimension n et u (-) est une fonction vecto- 
rielle continue de dimension r. La paire (x (+), u (-)) sera parfois 
désignée brièvement par z. 

L'élément z = (x (-), u (-)) € Z sera appelé processus de commande 
dans le problème (1’), (2”), si x (t) = q{t, x (t), u (t)), Vt € Léo, til, 
et processus de commande admissible, si, en outre, les conditions aux 
limites sont vérifiées. Un élément admissible z — (x (+), u (-)) sera 
appelé processus optimal dans le sens faible ou minimum faible du 
problème (1”), (2”), s’il donne un minimum local pour notre pro- 


blème, i.e. s’il existe un & —>0 tel que x —xl,<e et 
Hu — ul, <e impliquent Y (2) > Y (2). 


1.5.2. Conditions nécessaires du problème de Lagrange. Essayons 
d'appliquer au problème (1”), (2’) du sous-paragraphe. précédent 
la méthode générale de Lagrange, exposée dans 1.3.2. Comme dans le 
cas de dimension finie, la fonction de Lagrange s’écrira sous la forme 


1 
LC) UC); PC) = | Ldi+ (1) 


to 
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Lt, x, x, u)=p(t(r—œ(é, x, u))+Ahof(t, x, u), (2) 
l (Lo Ti) — 2 UjŸ; (To Xi); Ào — Uo- (3) 


Le fait que la « partie terminale » ou terminante / de la fonccion 
de Lagrange est de la forme (3) est évident : l’analogie avec le cas 
de dimension finie est ici complète. En ce qui concerne la contrainte 


x —œp(t, x, u), elle doit être vérifiée pour tous les £ € [to, t.l, le 
« multiplicateur de Lagrange » p (-) correspondant doit, par analogie, 
être une fonction de é, et sa contribution à la fonction de Lagrange 
doit être une intégrale, au lieu d’une somme. 

Ainsi, nous avons déterminé la fonction de Lagrange. En suivant 
le procédé de Lagrange, il faut maintenant chercher les conditions 
d’extrémum de l’expression obtenue « comme si les variables étaient 
indépendantes ». Autrement dit, il faut considérer le problème 


L(æ(-), u(-); pt), pd À) —+ extr, (4) 


en supposant que les multiplicateurs de Lagrange sont fixes. Le 
problème (4) est le problème de Boltz considéré dans 1.4.2. Les 
conditions d’extrémum qui furent trouvées dans ce sous-paragraphe, 
appliquées au problème (4), nous donnent des équations correctes, 
appelées équations d'Euler-Lagrange. Plus exactement, nous avons 
le théorème suivant. 


Théorème d’Euler-Lagrange. Si z=(x(.), u (+) est 
un processus optimal dans le sens faible pour le problème (1'), 
(2”) de 1.0.1, alors il existe des multiplicateurs de Lagrange 


Ào = >0 pour le problème de minimum u<0 et pour le problème 


du maximum, p (+) ECT([6, tal, R”), u = (Lu, nie Us); qui ne sont 
pas simultanément égaux à zéro !) et vérifient les équations d'Euler 


—LL.(, 20, 20, 2O)+ Lit 30, 20, 2()=0, () 


Lu (E, 20, 20, à@)—0, (6) 


1) Le mathématicien puriste notera l’inexactitude flagrante de cette 


phrase : À, et de sont des nombres, tandis que p (-) est un élément d’un espace 
de fonctions, de sorte qu’il est absurde de dire qu’ils sont simultanément égaux 
à un même zéro. Chacun d’eux peut être égal ou n'être pas égal à son propre 
zéro, provenant de l’espace one Mais nous avons tellement l’habitude 


d'identifier tous les zéros de tous les espaces, que cette phrase ne doit pas sauter 
aux yeux. 


6—0237 
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et la condition de transversalité 


L (ts & (tx), 2 (6x), & (fn) = 


=(—1} À x (t)), k=0, 1. (7) 





Puisque Z ne dépend pas de U, et / ne dépend pas de u, l’équation 
d’Euler relativement à w est de la forme dégénérée (6), tandis que 
les conditions de transversalité « relativement à w» disparaissent 
complètement. 

Ce théorème (même sous une forme plus générale) sera démontré 
au $ 4.1 comme corollaire direct d’un théorème général concernant 
la méthode des multiplicateurs de Lagrange pour les problèmes 
différentiables de dimension infinie. 

Notons que le théorème ci-dessus a pour corollaire la condition 
nécessaire d’extrémum du problème isopérimétrique (à nombre quel- 
conque de conditions isopérimétriques) et l’équation d’Euler-Poisson 
pour les problèmes à dérivées d'ordres supérieurs. Les contraintes 


isopérimétriques 
l1 
J; (œ(-)) = | HE Ta) di=Gs 1=1,::.:, mm; TER” 
to 


peuvent être prises en considération en introduisant des nouvelles 
variables de phase, liées aux anciennes par la contrainte différentielle 


Zn (D = fi (mm (tn (tit), . . … än (é)) et vérifiant les 
conditions aux limites 
Tn+i (1) — Ln+i (lo) = Gi, i=1,..., m. 


Si l’on applique maintenant le théorème d’Euler-Lagrange, on obtient 
les conditions nécessaires appropriées pour le problème isopérimétri- 
que. En ce qui concerne le problème aux dérivées d’ ordres supérieurs, 


il peut être réduit à la forme (1’), (2’) en posant x = x:, Ti = = Las 
7 Tn — u et en appliquant ensuite le théorème d” Euler-Lagrange. 


1.5.3. Principe du maximum de Pontriaguine. Dans les années 
cinquante, les nombreuses sollicitations des disciplines liées aux 
applications (technique, économie, etc.) stimulèrent la formulation 
et l'étude d’une nouvelle classe de problèmes d’'extrémum, qui 
furent appelés problèmes de commande optimale. La condition néces- 
saire d° extrémum pour les problèmes de cette classe — le principe 
du maximum — énoncée par Pontriaguine en 1953, fut démontrée 
et développée par la suite par ses élèves et collaborateurs (voir [14). 
Il est important de noter que cette condition a une forme qui diffère 
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essentiellement de celle des équations classiques d’Euler et de 
Lagrange : la résolution du problème de commande optimale néces- 
site la résolution préalable d’un problème de maximum auxiliaire 
(d’où le terme principe du maximum). 

Nous envisageons ici un cas particulier de la formulation générale 
du problème de commande optimale, à savoir celui du problème de 
Lagrange sous la forme de Pontriaguine (voir (1’) et (2”), 1.5.1), où 
apparaît encore une condition supplémentaire concernant la com- 
mande: uw € 1. Plus exactement, nous envisagerons le problème 
suivant : 


J'&(-); u(-))= 


1 
= (5 20), u (D) dt+bo(e (fo), (6) inf, (1) 
r(t)—p(i, x, u(b)=0, (tt), z(t)) = 
j=1, .….,s, (2) 
u EU. (3) 


Les fonctions f, p, Ÿ; sont les mêmes que dans les relations (1), 
(2°) de 1.5.1, tandis que Ÿ est un ensemble fixe de R'. Un 
problème encore plus général sera considéré au chapitre IV. 

Le problème de Lagrange avait été envisagé dans un espace de 
Banach. Dans le présent sous-paragraphe, nous voulons appliquer 
les méthodes les plus simples et nous prendrons par conséquent un 
autre choix d'éléments admissibles, qui ressemble à celui qui fut 
effectué dans 1.4.3, où le problème élémentaire du calcul des varia- 
tions RE avait été élargi à un problème dans l'espace 
KC° (Lt, t1]) des fonctions différentiables par morceaux. 

La paire (x (+), u (-)) sera appelée processus de commande pour 
le problème (1)-(3), si la commande u(-): [t,, t,]— U est une 
fonction continue par morceaux, la trajectoire de phase x (+) est 
continüment différentiable par morceaux et la fonction x (+) vérifie 
partout, saui aux points de discontinuité de la commande w (-), 
l'équation différentielle x (t) = œ (t, x (t), u (t}). Le processus de 
commande est appelé admissible si, en outre, les conditions aux 
limites sont vérifiées. k 

Un processus admissible (x (+); u (-+)) est appelé optimal s’il 
existe un & >> 0 tel que pour tout processus de commande admissible 
(x (+); u (-)) vérifiant | x (t) — x (()1<e, ViE ft, til, on a l’iné- 
galité J (æ(-); u() > 9 (&(-); u()). 

Essayons maintenant d’ appliquer au problème (1)-(3), la méthode 
générale de Lagrange considérée dans 1.3.2. La fonction de Lagrange 


[ES 
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du problème (1)-(3) sera la même que dans le problème de Lagrange : 
les contraintes sous forme d'appartenance (u € U) ne sont pas inclues 
dans la fonction de Lagrange. Ainsi 


t 
LC) UC); PO), Be A) | Lat+i, (à 
où : 
Lx, zu) =pO@—ptz 0) +hf( au,  E) 
L (Co: 2)= M; (Go; Zi)» Mo = Ào- (6) 
Ensuite, comme toujours, il faut considérer le problème 
L@&()u()3 pC), à À) + int (7) 


(en supposant que les multiplicateurs de Lagrange sont fixes) « comme 
si les variables étaient indépendantes ». Le problème (7) se décom- 
pose naturellement en deux problèmes 


L(æ(-), u(); pr), Ro) inf (pour z(-)), (8) 
L(æ(), u(-);3 p(-), Ro) inf (pour u(-)EL), (9) 


où par 4 nous avons désigné l’ensemble des fonctions continues 
par morceaux à valeurs dans U. Le problème (8) est à nouveau un 
problème de Boltz; quant au problème (9), il a, comme on voit facile- 
ment, la forme simple suivante 


1 
À x, u(t))dtinf, u(.)EU, (10) 
to 
où %(é, u) = Âof (té, Z(t), u)—p(t)q(t, Z(t), u). 
La condition nécessaire (et suffisante) d’extrémum dans le pro- 


blème (10) est tout à fait évidente: à (+) € %. donne un minimum 
au problème (10), si et seulement si partout, sauf aux points de dis- 


continuité de w (-), on a la relation 


min 4(t, u)=y(t, u(i)) 
ue 
 minL(t, x(b), x(t), u)=L (+,  (#), z (6), u (t) 
ue 
< max Pot, z(t), u)—hf(é x (, u)]= 


pdf, 2(, u(O)—f(é, z(), u(#). (11) 
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Les conditions nécessaires d’extrémum pour le problème (8), 
ajoutées à (11), nous amènent aux conditions nécessaires d’extré- 
mum pour le problème (1)-(3) qui sont connues sous le titre de 
principe du maximum de Pontriaguine (à 
cause de la forme spéciale de la condition (11)). Plus exactement, on 
a le théorème suivant. 

Théorème (principe du maximum de Pon- 
triaguine). Si (x(-), u (-)) est un processus optimal pour le 
problème (1)-(3), alors il existe des multiplicateurs de Lagrange 


ho=to>0, P(-)ERC! (Ie til, R#), = (Ur ..., Die), 
qui ne s'annulent pas simultanément et vérifient l'équation d'Euler 


+ Le 40; 20 u(t)=La(t, (+), 2, u(t)), (12) 


le principe du maximum (11) et les conditions de transversalité 


e 
#n 


L,(t, 20, 20, à D) = (0 EG (os 2 (0), 
k=0:1: (15) 


1.5.4. Démonstration du principe du maximum dans le problème 
à extrémité libre. Nous démontrerons ici le principe du maximum 
de Pontriaguine dans la situation la plus simple : lorsque la partie 
terminale de la fonctionnelle est absente, une des extrémités étant 
fixe et l’autre libre, ï.e. dans (1) de 1.5.8 on a d, — 0 et dans (2),— 


Ÿj (Lo: T1) = Loÿ — Toi: j = 1, s.., N. 
Aïnsi, nous envisageons le problème 





1 
JT &(), u(-))— | f(t, æ(t), u(t) dt — inf, (1) 
to 
(D—o(, z(, u())=0, (to) = To (2) 
u EU. (3) 


Les fonctions f, f,, @, p, sont supposées continues relativement 
à leurs variables. 


Voyons quel sera dans ce cas le RSipes du maximum de 


Pontriaguine. Puisque la fonction L(x,, 1) — Dr LL; (To; — Los) ne 


dépend pas de x, la condition de LL (143) de 1.9.3 
nous donne 


L. (ti, &(ts), &(6), u(4))— p (4) 0. (4) 
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Ensuite, l'équation (12) de 1.5.3 prend la forme 


+ Le+ls=0 > —p(=P(#) x (0) —Îofe (Es (5) 


où nous avons introduit les notations plus simples 


fx ()=fx(, x), u()), pr(t)= pt, z(), u(t)). 

Si l’on suppose que À, = 0, il découle de l’unicité de la solution du 
problème de Cauchy pour l'équation homogène (5) que p (-) = 0 
et donc, d’après la condition de transversalité à l'extrémité gauche 
(voir (13), 1.5.3), on a u — 0. Mais ceci est en contradiction avec 
l'hypothèse du théorème suivant laquelle tous les multiplicateurs de 
Lagrange ne peuvent s’annuler simultanément. Donc À, Æ 0 et 
l'on peut supposer que À, = 1. Mais alors p (-) se détermine unique- 
ment (en vertu de l’unicité de la solution du problème de Cauchy 
pour un système linéaire non homogène) par l'équation (5) et la 
condition aux limites (4). Mettant ensemble ce qui a été dit, on peut 
énoncer le principe du maximum de la manière suivante: 

Théorème (principe du maximum de Pon- 
triagnine pour e problème à extrémité 
libre). Si le processus (x (+), u (-)) est optimal pour le problème 
(1)-(3), alors La solution p (+) du système 


— p(t)= p (6) Pa (t) — fx (t) (6) 


à condition aux limites 


l 
x 


p (ti) = 0 (6a) 


vérifie le principe du maximum 


max (pot, z(t), u)—f(é, x(6), u))— 


—p{t)q(t, z(t), u(t))—f(t, xt), ut) (D 


aux points de continuité de la commande ü (:). 

Pour la démonstration de ce théorème, comme dans les cas pré- 
cédents, nous nous servirons de la méthode des variations. Nous 
commençons par la définition de la variation élémentaire en aiguille 
(de Weiïerstrass) semblable à celle qui fut appliquée dans 1.4.4. 
Désignons par 7, l’ensemble des points de (£,, t,) en lesquels la 
fonction & (-) est continue. Fixons le point t € T,, l'élément v Eu 
et le nombre À >= 0 si petit que [t — À, tl ft, #,l. 

La commande 


ua (t)=ua (Et; T, » = DE Di 


LV Si 2E[T—À, 7) 
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sera appelée variation élémentaire en aiguille de la commande ü (:). 
Soit za (é) = æa (t; Tv, v) la solution de l'équation x — œ (é, x, ua (t)) 
à condition initiale æa (to) = Æ (to) = x. Nous dirons que xà (t) 
est une variation élémentaire en aiguille de la trajectoire, tandis que la 
paire (za (£), ua (#)) est une variation élémentaire du processus 
(c (-), U (-)). La paire (t, v) qui détermine cette variation sera 
appelée aiguille élémentaire. 

La démonstration du théorème se décompose, comme 
toujours, en plusieurs étapes. Les deux premières étapes se rappor- 
tent entièrement à la théorie des équations différentielles ordinaires. 

A) Lemme sur les propriétés de la varia- 
tion élémentaire. Supposons que l'aiguille élémentaire 
(x, v) est fixée. Il existe alors un nombre À, >> 0 tel que pour0O £<\ LL 
on a: 

1) La trajectoire x, (+) est définie sur l'intervalle fermé (to, t.] tout 
entier et pour À | O on a x; (t) —+ x (t) uniformément sur to, Tl; 

2) pour t > T—T, 0 _ À < ho, la dérivée 


—— Z, (£ ; T;, v)=2 (1; T; v) 


existe, elle est continue relativement à À et pour À = 0 se définit comme 
étant la dérivée à droite; 

3) la fonction tr y () — Zo (t; T, v) vérifie sur l'intervalle fermé 
[t, t.] l'équation différentielle 


y = Ps (8) y (9) 
et la condition initiale 


y(D=p(r, z(r), v)—p(r, Z(v), (x). (40) 


La démonstration du lemme est basée sur deux faits 
connus de la théorie des équations différentielles ordinaires: le 
théorème local sur l’existence et l’unicité et le théorème de la dé- 
pendance continûment différentiable de la solution des données 
initiales. Ces théorèmes, sous une forme appropriée, sont contenus 
dans les manuels standards sur les équations différentielles ordinaires 
[8], [12], [131. En outre, le lecteur peut s’adresser au texte du $ 2.5. 


Démontrons d'abord le lemme ds le cas-où la fonction u C- ) est continue. 
Considérons les équations différentielles 


x = p (,;-x;-ur (£)).. (11) 


z= ç(r, 2, 8) : (12) 
D'après (8), les deuxièmes membres de ces équations coïncident pour é < T — À, 
et puisque zx (to) = zo = x (to), le théorème de l’unicité de la solution du pro- 
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blème de Cauchy entraîne que x (t) = x(t) pour t < 7% — À; par continuité 
EU = (T— A = 2x (T— A). (13) 
En particulier, & (À) possède une dérivée continue relativement à À et 


E(O)=z(t), E(0)=—z(1)=—œp(Tr, z(t), u (r)). (14) 


Désignons par € (t, s, &) la solution du problème de Cauchy pour l’équa- 
tion différentielle à commande fixe v: 


z=plzu), (= E. (15) 


D'après le théorème local d'existence et d’unicité on peut choisir des 
e, > 0 et 0 > O0 tels que E (t, s, Ë) est définie pour 


fé—tTi<ô, s—Ti|<ô, |E—z(r)|<e, 


tandis que le théorème de la dépendance de la solution des conditions initiales 
implique que # doit être une fonction continûment différentiable. 

D'après (8) et (13), pour définir x) (t) sur l'intervalle fermé [Tt — à, 7], 
nous devons poser Ë = E (À) = x (t — À) dans (15) et, si M << 6, est choisi de 
manière à avoir | E (4) —zx(t) | <e, pour 0<2À< À, alors 

tr HD =E(G, T—A, EG), T—A<I<T. 
En particulier, 
nO = (TD = E (tr, T —2, & Q)) (16) 


étant la composée de fonctions continûment différentiables est elle-même une 
fonction continûment différentiable en à et 


n (0) = x (1), n° (0) = —5, (x, v, E (0)) + 8 (v, %, Ë (0)) &’ (0) — 
= —2, (x, v, (0) — Be (x, %, É(O)p(r, zx), 2 (T5) (17) 


d après (14). La solution & (t, s, &) du problème de Cauchy (15) vérifie l’équa- 
tion intégrale équivalente 


t 
at, s, D=E+ | p(o, (o, s, Ë), v) do. (18) 


Calculant la dérivée par rapport à s, on a 
Est, s, £)= 


t 
= —œp(s, Es, s, Ë), + | Pr (0, E(o, s, Ë), v)E,(0, s, 6) do, 


et en posant { — s — %, £ — x (x), on obtient (en se servant de l'identité évi- 
dente E (t, t, &) = jé) 


ft, T, z(T))=—pt, z(r), v). (19) 


D'une manière analogue, en prenant la dérivée de (18) par rapport à & et en subs- 
tituant les mêmes valeurs des variables, nous obtenons 


e(t, T, 2 (t)=E (20) 
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(ici E = (06,/08,) — (ô;2) est la matrice unité). Substituant (19) et (20) dans- 
(17), nous obtenons 


n(O=z(r), n'(O=p(t, tit), v)—p(t, z(r), u(r)). (21): 


Ensuite nous voyons que la fonction & est continue au point (x, t, x (t))- 
et l’on a & (x, t, x (x)) = x (x), tandis que x (+) est continue au point +. Par 
conséquent, pour tout & > O0 on peut trouver un Ô > O0 tel que pour 


[t—rl<6, Is—TI<ô, |E—T(t)1<6 
on a les inégalités 
[E(G, s, É—r(mDl<e/2, |2z(t)—2(t) | <e/2. (22): 


Prenons un nombre positif À < 6 si petit que pour 0 < À < À, on aie l’iné- 
galité | E(M)—z(x)| 6. Alors pour T—A<SIST, s—=T—X et E — 
— £ (À) on aura les inégalités (22), d'où 


la ()—r(t)I=IE(, TX, E()—z()l< 
LE, TA, E(A))—r(T)1+ x (T)—x(t)| <e/2+e/2=e.. 

Puisque x ({) = x (t) pour 4 <t<7T—À,on a 
0Si<h=ln t—-rbÜl<e < 


ce qui démontre la première assertion du lemme. 

Désignons maintenant par X (+, n) la solution du problème de Cauchy 
pour l’équation (12) à condition initiale x (t) = n. D’après le théorème de la 
dépendance des solutions des conditions initiales, il existe un €, tel que X (£, n)- 


Lo 


< T; 


est définie pour | n — 7 (T) | < 6, TLt<Lt,, tout en étant une fonction: 
continüment différentiable. D’après (8) et (16), en vertu du théorème d'unicité, 
on a 1 (t) = X (t, n (À)). À nouveau, étant la composée de fonctions continû-- 
ment différentiables, la fonction x3 (t) est continûment différentiable en (#, À) 
pour T£<t<tet0<AÀ< A, où À, à été choisi de manière à avoir l'inégalité 
In —zxz(T)i<e pour 0LÀ<AÀ,. En posant À, = min (4, À+), nous- 
voyons que la deuxième assertion du lemme est également vérifiée. 

Passant de l’équation (12) à l’équation intégrale équivalente, nous obte-- 
nons compte tenu de (16) 


t 
m1, W=n@)+ | (0, z1 (0), & (0) do. 
T 


Prenant la dérivée de cette équation par rapport à À et en posant ensuite À = 0,. 
nous obtiendrons, en désignant, comme dans la condition du lemme, y (t) — 


2 HE (#) Fa la relation suivante 
t 
= n (+ | ox (0, à (0), à (0) v (0) do. 
T 


Cette équation intégrale est équivalente à l’équation (9) à condition initiale- 
y (t) = n’ (0) qui coïncide avec (10) en vertu de (21). 
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Si la commande u (-) est une fonction continue par morceaux, il faut agir 
de la manière suivante. Pour simplifier, supposons qu’il y a deux points de dis- 


continuité, mettons ©, et æ&, et que le point t (où L (-) doit être continue) est 
situé entre eux: {9 < y LT LA < t1. Dans la bande t, < t < oo les systè- 
mes (11) et (12) (dans lesquels, pour t — «,, on doit poser la commande égale 


à sa valeur limite y (ay — 0) = lim ü (t)) coïncident et, d'après le 
t@&1—0 
théorème d’unicité, za (t) = x (t). 
Passons maintenant à la bande &; < t < &, (en supposant à nouveau que 
sur ses frontières la commande est égale aux valeurs limites u (4, + 0) pour 
t= et u (æ — 0) pour t = æ&,). Ici il faut résoudre les équations (11) et 


(12) à condition initiale x = x (&). Nos assertions précédentes sont applicables 
et nous voyons donc que x; (t) est continûment différentiable en À. 

Enfin, dans la bande &, < t < t, (avec la même convention pour les valeurs 
de la commande lorsque £ — @&,), nous trouvons la solution de nos équations 


différentielles à conditions initiales x (&) et x (&,). En se servant encore une 
fois du théorème sur la dépendance de la solution des conditions initiales, on 
démontre le fait que xA (£) est continûment différentiable en À pour &œ << t<t: 


et l’on calcule y (t) — TX à (t) 11=0 de la même manière que précédemment. ll 


B) Lemme sur l'accroissement de la fonc- 
tionnelle. Posons %(À) = Ÿ (xx (+), u (-)) et démontrons 
que cette fonction est différentiable à droite au point À = 0. 

Soit p (+) La solution du système (6) à condition à la limite (6a). 
Alors 
NH O0) = S (ea (+) a (-))he+o = a (© v), 


OÙ 
a(r, v)=f(r, 2x), v)—f(r, z(r), u(T)— 


—pÜnlp(r, Z(), v)—p(r, z(, u(D). (23) 
Démonstration. Puisque 
lt li 


XD) —2 (0) = { (6, zx (0), un ea | Ft EU Sade 
t t, 


li 
— | HG m6), 2) (6 20), 8()]di+ 
T 


+ À LC, a (0, ft, 20), à ()] dé, 


“On à T-À 


1 (0)=lim 100 | FE, 210, 0) dt) 
T 


—- 


+0 


Him (He, ot 20, 2) ar. 
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Puisque, d’après le lemme de A), la fonction x (é) est continûment différentiable 
par rapport à À, on peut appliquer au premier terme la règle usuelle pour le 
calcul de la dérivée sous le signe de l'intégrale et se servir du théorème de la 
moyenne pour le deuxième terme; on obtiendra alors 

la 


0e | it, 50, 20e D) d+ 
T 


lim ff(c, æ(c), v)—f(c, z(c), u(c)]= 
11,0 


fat, 2), a())y()dt+f(r, z(r), v)—f(r, sit), ut) (24 


{ici nous nous servons du fait que t — À < c < T et donc c + T; xx (c) — x (1) 
d après la première assertion du lemme de A); y (t) désigne la même fonction 
que dans ce lemme). 


Par ailleurs, p (+) vérifie le système (6), et y (-) vérifie le système (9). 
Par conséquent 


OPINION IOETTOFIOE 


= D (1) Pa (0) He 0) 0 CHR (D Pa (0) 8 (0) = fx (6) y CE) 
Calculant l'intégrale de cette égalité de t à #,, prenant en considération 
la condition (6a) pour p (-) et la condition (10) pour y (+), on obtient 
ti ti 
Lx d _n n li 
MAOPOP ES ER CIOPIOL ES TOPICS 
T T 
sp (T) [p (T, T (t), v)—@ (T, Le (T), u (t))]: (25) 
La comparaison de (24), (25) et (23) nous donne %° (+0) = a (x, v). M 
C)Conclusion de la démonstration. Si l’extré- 
mité droite est libre, il découle du lemme de A) que toute variation 
élémentaire est admissible (pour À suffisamment petit). Par consé- 


quent, si (x (+), u (-)) est un processus optimal, on aura, pour des À 
suffisamment petits, 


Ja) mC)2I GC) uC) 10210) +x (+0,20. 
En appliquant le lemme de B), on voit que la condition a (t, v) > 0 
est nécessaire pour l’optimalité de (x (+), u(-)). Mais TE T, et 
v € U étaient arbitraires. Nous avons démontré ainsi que pour tout 


point t{ de l’ensemble des points de continuité de la commande & (:) 
et pour tout u € 1, on a l'inégalité 


pot, 20, u)—f(, x, u)< 


Lpitjo(é, z(), u(H)—f(t, z(t), u (6), 


équivalente à l'inégalité a (t, u) > 0 et à (7). Le théorème est entière- 
ment démontré. 
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$ 1.6. Résolution des problèmes 


Les problèmes dont nous avons parlé au début du chapitre, pro- 
blèmes qui furent posés pour différentes raisons et à des époques diffé- 
rentes, seront envisagés ici d’un point de vue uniforme, suivant un 
même schéma standard dicté par le principe de Lagrange. 

Ce schéma comprend six étapes: 

1. Expression du problème formalisé et discussion de l’existence 
et de l’unicité de la solution. 

2. Construction de la fonction de Lagrange. 

3. Application du principe de Lagrange. 


4. Etude de la possibilité d’avoir À, = (. 

o. Recherche des points stationnaires, i.e. résolution des équa- 
tions qui découlent du principe de Lagrange. 

6. Etude des points stationnaires, choix de la solution et expres- 
sion de la réponse. 

Dans tous les problèmes que nous allons considérer le principe de 
Lagrange est un théorème rigoureusement établi: soit démontré 
antérieurement, soit démontré dans les chapitres ultérieurs. L’appli- 
cabilité d’un même schéma aux problèmes de caractère si différent 
souligne l’universalité de ce principe. Il va de soi qu’en considérant 
d’autres problèmes, les chercheurs peuvent rencontrer des situations 
dans lesquelles aucun des schémas concrets déjà connus (calcul des 
variations classique, commande optimale, programmation linéaire, 
etc.) ne convienne. Toutefois, le principe de Lagrange sous une 
forme ou une autre peut s'avérer utile même dans ces cas, par exem- 
ple pour donner une indication générale. La compréhension des idées 
et des situations générales auxquelles il est applicable — nous en 
reparlerons aux chapitres III et IV — peut nous aider à trouver des 
conditions nécessaires d’extrémum dans la nouvelle situation envisa- 
gée. Remarquons par ailleurs qu'il est tout aussi important de com- 
prendre que le principe de Lagrange n’est pas toujours vrai, et il 
ne faut pas s’en servir à tort et à travers. 


1.6.1. Problèmes géométriques d’extrémum. Ici nous trouvons 
la solution de tous les problèmes posés dans 1.1.2 et formalisés dans 
1.2.2. La première étape du schéma proposé consiste à étudier la 
question de l’existence des solutions. Les problèmes géométriques 
de ce sous-paragraphe sont de dimension finie, et l’existence des 
solutions est affirmée par le théorème suivant. 

Théorème de Weierstrass. Supposons que la fonc- 
tion f: RN — R est continue et que l’ensemble £,f = {x | f (x) < a} 
est non vide et borné pour un certain a. Alors la solution du problème 
Ï (x) —- inf existe. 

La démonstration de ce théorème découle d’une maniè- 
re évidente du théorème classique de Weïerstrass sur l’existence d’un 
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minimum d’une fonction continue sur un sous-ensemble fermé et 
borné de l’espace RAN ([6], vol. 4, pp. 176, 370 ; [111, vol. 1, p. 234), 
car l’ensemble Z,f est évidemment fermé. 

Passons à la résolution des problèmes. 

Problème d'Euclide sur le parallélogramme inscrit. 
Ce problème a été formalisé aïnsi (voir (1), 1.2.2): 


4 fox) =zxz(x—-b)— inf, 0<Lzr<b. 
Nous avons omis le facteur A/b qui ne joue aucun rôle et avons 
réduit le problème à un problème de minimisation. La fonction f, 


est continue, l'intervalle [0, b] est borné et fermé. D'après le 
théorème de Weïierstrass, une solution du problème existe. Soit 


x cette solution. Il est clair que x 0 et x = b, car fo (0) = fo (b) = 
— (, tandis que la fonction prend aussi des valeurs négatives. Par 


conséquent, x € (0, b). La fonction f, est différentiable. Il faut donc 
chercher des points stationnaires du problème f, (x) — inf. 


2 à 5. f{ (x) = 0 x — b/2. 


6. Puisque le point stationnaire est unique, x — b/2 € [0, b] est 
la solution du problème, i.e. le parallélogramme cherché ADÉF est 
caractérisé par la relation | AF | = | AC |/2, donc F est le milieu du 
segment |A, CI. Ce fait avait déjà été démontré dans 1.1.2 par un 
raisonnement géométrique. 

Remarque. Notre problème est donc un problème différen- 
tiable élémentaire. Par conséquent, la fonction de Lagrange n’a 
pas été décrite explicitement et les étapes 2 à 5 se sont « confondues ». 
Nous nous sommes servis du théorème de Fermat (1.3.1). 

Problème d'Archimède sur les segments de sphère 
isopiphanes (voir 1.2.1). La solution est tout à fait analogue à celle 
du problème d’Euclide ; nous la donnons sans commentaire. 


1. fo() = ha/2—nh3/3 = sup: 0<h<Va/x. 

2 à 5. f(h)}=0—h=V alèn. 

6. La valeur de f, à l'origine est nulle, au point V/a/x elle 
est inférieure à la valeur au point stationnaire / a/2x. Par con- 
séquent, h = V a/2n est la solution du problème. Rappelons que 


a=2nRh : nous obtenons À —= R, i.e. le segment sphérique cherché 
est la demi-sSphère (sa hauteur est égale au rayon). 
Problème d'Apollonios sur la plus courte distance 
d'un point à une ellipse. Il avait été formalisé ainsi (voir (6), 1.2.2): 
1. fo (is To) = (1 — &1)° + (te — 62)? —+ inf; 
fa (is Le) = (ti/@) + (cola)? = 1. 
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L'’ellipse est un ensemble fermé et borné, la fonction f, est continue, 
donc la solution x = (x, x.) existe d’après le théorème de Weierstrass. 
Les fonctions f, et f, sont différentiables. 


2. L — Ào ((t1 — 81) + (te — 62)7) + À ((a1/@1)? + (x2/a2)? — 1). 
8. Lu =0 = Do (ri — Er) + huty/a? = 0, 
Lars =0 = ho (Lo — E) + \ito/a? = 0. 


4. Supposons que À = (0. Alors LA = 0 (les multiplicateurs de 
Lagrange ne peuvent s’annuler simultanément!). Par conséquent, 
il découle de la troisième étape que 


== 0— f(0, 0) = fi (Gas t2) = 0 £ 1. 


Ainsi, ho 0 et l’on peut poser 0 = 1. Désignons maintenant 
M = À. 
9. (Pour simplifier, nous nous limitons au cas où EiËo = 0.) 


d " | = Gia? | 
(t; —Ë;) + Ax;/ai= 0, i= À, ne ETES tt, 2; 


En substituant dans l’équation de l’ellipse, on obtient 


a 
| p (À) — ET + Sr = 1. (1) 
6. Le nombre de points stationnaires du problème (i.e. des 
points qui correspondent aux valeurs de À vérifiant l’équation ({)) 
ne peut excéder quatre (voir fig. 26, 
l'inégalité q (0) = E/ai + ES > 1 
montre que œ (À) y est représentée 
pour un point (E,, &,) situé à l’exté- 
rieur de l’ellipse). Pour une solution 
complète du problème, il faut résou- 
dre l’équation (1), obtenir À;, 
trouver les points correspondants 
x (À;), substituer ces points dans fo 
et trouver le plus petit des nombres 
obtenus. 
Remarques. 1. Le problè- 
me À est un problème différentiable 
Fig. 26 à contrainte sous forme d'égalité. 
Dans les étapes 2 à 5, nous avons 
appliqué la méthode des multiplicateurs de Lagrange (voir 1.3.2). 
2. La relation (x, — Ë;) + Ax;/a? — 0 a une signification gée- 
métrique évidente: le vecteur £ — x qui joint le point £ au point 
minimal x est proportionnel au vecteur gradient de la fonction f, 
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au point x, i.e. le vecteur £ — x est normal à l’ellipse. Ce fait fut 
découvert tout d’abord par Apollonios. 

3. Nous allons maintenant déduire des relations obtenues l’équa- 
tion de la courbe qui « sépare » les points £ par lesquels passent deux 
normales des points par lesquels il en passe quatre. Il est évident 
que cette séparation a lieu pour À vérifiant la relation (1); on à 


AE(—ai, —a;). (2} 


ELLE ee 
ps —— 


Il découle de (2) que 
+= A (Ba), af + À = —A (E,a,)#15, 


A = (ai — a;)/((1a1)%5 + (62@2)°). 


En substituant cette valeur dans (1), on obtient l’équation de la 
courbe de séparation 


(Era) + (Ene = (a — a). 


C'est l’équation de l’astroïde (voir fig. 7 au $ 1.1). En dehors de 
l’astroïde, chaque point possède deux normales, à l’intérieur, quatre, 
sur l’astroïde elle-même, trois (sauf aux sommets, où il y a deux 
normales). Le résultat décrit ici avait également été obtenu par 
Apollonios dans son traité sur les coniques. 

Problème de Kepler sur le cylindre inscrit (voir (3), 
1.2.2). La résolution de ce problème est semblable à celle du pro- 
blème d’Euclide, et nous la laissons sans commentaire. 


1 fox) = x — 1) ini, 0<Lzr<i. 


2 à 5. f(x) =0= 321 > 7 = V 3/8. 

6. D’après l’unicité du point stationnaire dans (0, 1), on voit 
que z7— V3/3 est la solution du problème : Le cylindre cherché est 
caractérisé par le fait que le rapport de sa hauteur 2x au rayon 
V1 est égal à V 2. 

Problème de réfraction de la lumière. 
Ce problème avait été posé et résolu par la méthode de Huygens dans 
1.1.3. Nous donnerons ici sa résolution standard, dûe à Leibniz 
(voir (4), 1.2.2). 

1. f (9 = VF + VER ED iv, — inf. 


Tous les ensembles de Lebesgue Z,f, d’une fonction continue f, 
sont compacts, par conséquent, l'existence de la solution découle 
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du théorème de Weierstrass. 


Les 


nm Vars ou V R+E—5y 
sin P; _ Sin Pa 
Ur EH Vo 


<— 





2 à 5. f (2) —0— 


<— 


(voir fig. 19 dans 1.2.2). 


6. Le point x satisfaisant à la dernière équation est unique 
(vérifier !), c’est donc une solution du problème. Ainsi le point de 
réfraction du rayon lumineux à la surface de séparation de deux 
milieux est caractérisé par le fait que Le rapport du sinus de l'angle 
d'incidence au sinus de l'angle de réfraction est égal au rapport des 
vitesses de la propagation de la lumière dans les milieux correspondants. 
C'est là justement la loi de Snellius. 

Problème de Steiner. Ilavait été formalisé comme suit 
(voir (5), 1.2.2): 


1. f(r)=Ir—Ekil+ir—-kl+ir-ésl inf, z2eR, 
E,ER?, i—1,2,3, Ir] =Vri+a. 
La solution du problème existe en vertu du théorème de Weïerstrass 
(vérifier!). Il y a deux possibilités : ou bien la solution coïncide avec 


un des points E;, i — 1, 2, 3, ou bien diffère de chacun d'eux. Cher- 
chons la solution du problème dans le dernier cas. Alors la fonction 


sera différentiable au voisinage du point x (vérifier !). 


28 5. f(@=0— HE + Hs | Re 6, (3) 
[r—Ë;l [z—é2| [r—£3l 


6. L’équation (3) signifie que les trois vecteurs unités qui regar- 
dent du point x dans la direction de E,, &,, Ë3 respectivement ont 
une somme nulle. Par conséquent, ces vecteurs sont parallèles aux 


côtés d’un triangle équilatéral et les angles E,xE., ETES EsrE, sous 
lesquels on voit les côtés du triangle à partir du point x sont de 


120°. Ainsi le point x est le point de Torricelli. Il peut être également 
trouvé comme le point d’intersection de deux arcs de cercle sous- 
tendus par les cordes [E,, ë.let [£., 6:l et correspondant à des angles 
de 120°. Cette construction est possible si aucun des angles du tri- 
angle n’est supérieur à 120°. Dans le cas contraire, les arcs ne se 
coupent plus, et il est donc impossible que le point x ne coïncide pas 
avec un des points &;, à — 1,2, 3. Mais alors il doit évidemment 
coïncider avec le sommet de l'angle obtus, car le plus grand côté 
du triangle est opposé à l'angle obtus. 
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Réponse: Le point cherché est le point de Torricelli, si tous 
les angles du triangle sont inférieurs à 120° : c'est le sommet de l'angle 
obtus dans les autres cas. 

Ainsi, tous les problèmes géométriques que nous avions considérés 
dans 1.1.2, ainsi que le problème de la réfraction de la lumière 
(1.1.3) sont résolus. En passant, trouvons la solution du problème 
de Tartaglia: 


4. f(x) =x(8—2)(8—-2x) sup, 0LIr<4. 
2 à 5. f(x) —0= 322 24743920 7—4— 4/3. 


6. Réponse: Un nombre est égal à 4—4/V 3, l'autre à 
4-LA4/Y 3. 

1.6.2. Problème aérodynamique de Newton. Ce probcème aété 
posé dans 1.1.5 et formalisé dans 1.2.3. 


1. [+ int, z=u, 2(0)=0, zx(T)=Ë, uER.. 
0 


Pour les problèmes de ce genre, il est difficile de démontrer 
directement le théorème d'existence. L’ennui principal provient de la 
non-convexité de l’intégrante t/(1 + u?) relativement à uw pour 
u > 0. Nous donnerons néanmoins une résolution complète de ce 
problème. Notre plan est le suivant. En supposant que la solution du 
problème existe, nous appliquerons à la solution hypothétique le 
principe de Lagrange. Ayant trouvé qu'il existe une seule courbe 
stationnaire admissible pour ce problème (ï.e. une courbe admissible 
pour laquelle toutes Les conditions dictées par le principe de Lagrange 
sont remplies), nous vérifierons par un calcul direct que c’est bien 
elle qui donne le minimum absolu. En conclusion, nous rappelons le 
texte de Newton: nous verrons que la solution trouvée est exacte- 
ment celle qu'il décrivit en 1687. 


T 
2. £= | L di + por (0) + pu (x (T) —E), 
0 


ot 


L= TEE + p(x—u). 





3. Equation d'Euler: 
TL. +Li=0= p(#) = Cte= po. (1) 


Condition de transversalité: 
Po = lo = — (2) 
7—0237 
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Condition de minimalité par rapport à u: 


fot Rot : 
Tu? Pou => ne Pou (£), Vu=0 (3) 


4. Si l’on suppose que À —0, on à nécessairement p, Æ 0 


(autrement (2) impliquerait les égalités Ào = Po = Lo = y = 0, mais 
tous les multiplicateurs de Lagrange ne peuvent s’annuler simul- 


tanément). Si l’on a À=0 et Po 0, alors (3) implique que 
L 


u (= 0 et donc % (t) — | ü (4) di = 0. 
0 

Maïs alors le corps cherché n’a pas de « longueur », c’est une 
membrane plane. Si £ = 0, alors À, 0 et l’on peut supposer que 
À, = 1. Remarquons également que le cas p, > 0 est aussi impos- 
sible, car dans ce cas la fonction (£/(1 + u?)) — pu serait décroissante 
monotone et (3) ne serait plus vérifié pour w >> à (t). 

5. Il découle de (3) (avec À) — 1) que, jusqu’à un certain moment, 
la commande optimale est nulle (vérifiez que pour p, 0 et # petit 
la fonction ur (£/(1 + u?)) — pu atteint son minimum pour 
u — 0). Ensuite la commande optimale à (-) s'obtient de l’équation 


2ut 

Po Gr ? (4) 
qui découle de l’équation L, — 0. Le moment de cassure t est 
déterminé par le fait que la fonction u ++ (t/(1 + u?)) — pu possède 
deux minimums égaux : au point zéro et au point déterminé à partir. 
de (4) pour t — t. Autrement dit, le moment de cassure doit vérifier 

les relations (où, et par la suite, à (x) désigne à (rt + 0) 0): 

Qu (T)T T ds 
— po D, pu =T. (9) 
(+ u? (T))* 1+u? (7) 


Il découle de la deuxième équation que 


— U? (tr) T/(L + u? (r)) = pou (T), 

d’où l’on tire p, — —7Tà (x)/(1 + à? (x)). En substituant cette 
relation dans la première équation de (5), nous trouvons que 
à? (x) = 1 = à (rx) = 1 (puisque à > 0) et alors, en nous servant à 
nouveau de la première des équations (5), nous obtenons l'égalité 
T = —2pD,. 

Après la cassure, la solution optimale doit vérifier la relation 
(4), qui implique 


= — HO L de (Eau tu). (6) 
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de de de dt m1 ) 
dt UT du dt du “du 2 ( PS | 
En prenant l'intégrale de cette relation compte tenu des égalités 
x (t) = 0, à (t) = 1, on obtient l’équation paramétrique de la courbe 
optimale cherchée 


x (#, po)= — ++ (In + ur + eu) + Po 
7 
t— — he (++autut), Po < 0. 


6. La courbe (7) est appelée courbe de Newton. On a d’après (7) 
u E [1, œ). On voit aisément que l'intersection de la droite x — at 
avec la courbe de Newton, qui correspond 


au paramètre po — —1, est unique. En 
effet, x (-, —1) est continue et convexe 
puisque 

2 

d?x _ du du a (à 


dt? dt => 


Mais, d’autre part, on voit d’après les for- 
mules (7) que la courbe de Newton x (-, po) 
s'obtient de la courbe x (+, —1) par homo- 
thétie de centre (0, 0) et de rapport |p, | Fig. 27 
(fig. 27). Par conséquent, pour faire pas- 
ser une courbe de la famille (7) par un point donné (£, T), il faut 
trouver le point d'’intersection de la droite x — Et/T avec la 
courbe x (+, —1) et ensuite effectuer l’homothétie correspondante 
de la courbe x (+, —1). Nous obtiendrons une courbe admissible 
x (-). Vérifions qu’elle donne un minimum absolu pou notre pro- 
blème. Pour cela revenons à la relation (3) avec À, = 1. Soit x (.) 
une courbe admissible quelconque (i.e. x (+) € KC! (10, T1), x (0) = 
= 0, x (T) = Ë). Alors d’après (3) 

t 


0 T t 


t 


— — — pot (> —— — più (£). 
1x? (t) 1+u (4)? 
Prenant l'intégrale dans cette relation et en se servant du fait 


‘ T ° iQ 
que 4 ({)—x (t) et IE0 di — À z (dt =E, on obtient 
0 





Le problème est entièrement résolu. 


7* 
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Remarques. 1. Dans 2 à 5 nous avons appliqué le principe 
de Lagrange à un problème de commande optimale qui se réduit 
au principe du maximum de Pontriaguine (1.5.3). 

2. Comparons maintenant la solution obtenue avec celle qui 
fut décrite par Newton lui-même. Rappelons les paroles de Newton, 
citées dans 1.1.5, et voyons encore une fois son esquisse (voir fig. 18). 
En plus des lettres employées par Newton, nous nous servirons en 
même temps de certaines de nos propres notations. Nous avons 
[MN |=1t, |BM]|= 2x, | BG] = 7, l'angle BGP est égal à o:; 
il découle alors de la construction de Newton que 


t@p=z(t), |BP|/|BG|=tep—|BP |— «x, 
[GPF=IBGP+|IBPP—= (+1). 
Maintenant, d’après le rapport de Newton, 
IMN|:1IGP|=1I|GPP:4(|BP | X |GB P), 


ou, en substituant nos propres notations, nous obtenons 


! _ w(a?+1)9/2 Le xt æ. & 


(a2+4)/2% art? (x? +1) 

Mais ceci est précisément la relation (4), dans laquelle on a substi- 
tué la valeur p, — —T/2. En raisonnant comme précédemment, à 
partir de (8), on trouve par intégration l'expression (7) pour la 
courbe de Newton. Remarquons également que le caractère « obtus » 
de la courbe et la condition relative à la cassure au point G = 7 
(l’angle y est égal à 135°) furent en fait pris en considération par 
Newton dans son Commentaire concernant le cône tronqué. 

Aïnsi le problème de Newton fut entièrement résolu par celui-ci, 
mais la signification de sa solution resta inabordable non seulement 
pour ses contemporains, mais pour de nombreux de ses successeurs — 
jusqu’à nos jours. 


1.6.3. Problème élémentaire de temps minimum. Le problème 
posé dans 1.1.7 a été formalisé de la manière suivante: 


T — inf, mE = u, u E [u,, ul, 
x (0) =, z(0)=vx x(T)=2(T)=0 


(voir (9) dans 1.2.4). Le cas u, = u, ne présente aucun intérêt, puis- 
qu’alors pour chaque paire (xs, 09) il n’existe pas une fonction x (-) 
qui vérilie toutes les contraintes (1), et si une telle fonction non 
identiquement nulle existe, alors la valeur de T est uniquement 
déterminée ; il n’y a donc aucun problème de minimisation à con- 
sidérer. 


(1) 
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Pour uw, << u, nous pouvons faire décroître le nombre des para- 
mètres du problème en effectuant la substitution x (f) — AË (t) + 
+ B (t — T}*. En termes de la fonction & (-), la forme générale du 
problème (1) ne change pas, mais les paramètres Zo, Vo, WU, U2 pren- 
nent de nouvelles valeurs. En particulier, si l’on pose 


A — (u ES u,)/2m, BE — (u, — u,)/4m, 
alors EE [—1, 1]. Prenant ceci en considération, nous supposons 
maintenant que dans ({)on am = Î1,u, = —1Â,u, = +1. En outre, 


introduisons les notations x — x,, æ = %o. 
Passons maintenant à la réalisation de notre schéma habituel 


1 
{. T= |1.dt+int, Ti = To, Lo =U, u E[—1,1], 
i (2) 


t(0)—zo, 22(0)=ve, æ(T)=2x(T)=0 


En ce qui concerne l'existence de la solution, nous raisonnerons 


comme dans le sous-paragraphe précédent: ayant trouvé à partir 


du principe de Lagrange une fonction x (+) « suspecte » d’optimalité, 
nous montrerons, par une vérification directe, qu'elle donne effecti- 
vement la solution du problème. 


T 


2. &= | L di+ qu (as (0) — x) + pa (22 (0) — vo) + 
0 
+ Vita (T7) + Vate (D), (3) 


Où L=o+ pi (ti — 22) + pa (to — u). 
3. Equations d'Euler-Lagrange 








dp: dp. : 
dt = 0,  — —— Pi: (4) 





d 
Conditions de transversalité 


pa(O)=ha De (O)=he Pa(T)=—vy pe(T)=—vy (5) 


Principe du maximum: en éliminant les termes qui 
ne dépendent pas de u, on peut récrire cette condition sous la forme 


pe OuG=. max {pe (€) u}= |p2 (6) 


ou 
LL (t) _ qe P2 (£), S1 Do ( ) Æ 0, (6) 
élément arbitraire de [—1, 4], si Ps ( == 0; 
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En outre, dans le problème considéré, le moment terminal T 
est variable aussi (c'est justement cette variable que nous minimi- 
sons), de sorte que ce problème, du point de vue formel, ne peut se 
placer dans le cadre de 1.5.3. On peut montrer, ce que nous ferons au 
chapitre IV, que dans cette situation il faut ajouter aux équations (4) 
à (6) une nouvelle condition £7 — 0 (la stationnarité de la fonction 
de Lagrange relativement à T}), qui est tout à fait conforme à l’idéo- 
logie générale du principe de Lagrange. En prenant la dérivée de 


(3) par rapport à T' et en se servant des égalités Lo (T) = u (T), 
Z1 (T) = x, (T) = 0, on obtient 


Le = À) Vu (T) = (7) 


: 4. Dans ce problème, il n’est d'aucune importance de savoir si 
À S’annule ou non, puisque À, ne participe pas aux équations (4) 
à (6). 

5. Il découle des équations (4) que p,(t) = Cte, tandis que 


Pa (-) est une fonction linéaire quelconque. On a alors p, (t) #0, 
parce que 

x (He 

Pe (t = 0 p, Dee ere =V=v=0— 0 


et tous les multiplicateurs de Lagrange s’annulent. 

Une fonction linéaire non identiquement nulle s’annule sur le 
segment [0, 7] au plus une seule fois. Par conséquent, on obtient 
d’après (6) les possibilités suivantes pour la commande optimale: 


a) u(t) =1; 
b) u(=—1 
(Po (-) ne s’annule pas sur [0, T]), 
> LOTS. 
É 6=[_{ 1<tET, 
. An — À, OT T.: 
d) à (9 —| D. 
LT: 


P2 (-) S’annule au point £ — t, la valeur de la commande au point 
t — + est sans importance, car son changement en un seul point 
n’influence pas la fonction x (+) (pourquoi ?). Mais pour cette même 
raison, on peut laisser de côté les cas T7 = T et t = 0. 

Les considérations suivantes seront effectuées sur le plan de phase 
(x1, 22), ce qui est plus commode (fig. 28). En résolvant le problème 
de Cauchy 


T2 M=ut(t), 2(T)=2(T)=0 (8) 
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pour une des commandes a) à d), nous obtenons une solution unique, 
et avec celle-ci un point initial unique (xo, vo) = (21 (0), x, (0)) qui 
correspond à cette solution. On vérifie aisément que, pour tous les 
T et T, ces points initiaux recouvrent le plan tout entier. Tout 
d'abord 


D=tn =l—am = 2/2 + Ci, (9) 
= D=1+u=-1#/2+0;, (10) 


de sorte que les trajectoires de phase sur les parties où la commande 
est constante sont situées sur Îles 
paraboles d’une des familles (9) 
ou (10). 

A la commande a) correspon- 
dent les points initiaux situés sur 
l'arc OFA (fig. 28): xo = L?/2, 
Vo LO0; à la commande b}), les 
points de l’arc ODB : x, — —v?/2, 
Vo > (0. 

Les points initiaux C, situés à 
gauche de la ligne de séparation 
BDOFA (x, = —v9 | vo |/2), cor- | 
respondent aux commandes c): Fig. 28 
sur l'arc CD de la famille (9) à ()= 
= 1, au moment { — x nous arrivons au point D, ensuite ilya un 
changement de commande et l’ on se déplace le long de l'arc DO 
avec à (t) = E à droite de 
la courbe séparatrice correspondent les commandes d). 

6. Il nous reste seulement à montrer que la solution unique ainsi 
trouvée x (ft) = % (£), correspondant au point initial (x,, v,), donne 
effectivement une solution du problème (2). 

Supposons qu'une certaine fonction x (-) est définie sur le segment 


{0, T|, possède une dérivée seconde continue par morceaux et 











x (0)=x» &(0)=w» æ(T)=x(T)—0, 


où T & T. Pour T € T, nous prolongeons la définition de x (-) en 


posant xæ(t) = 0, 6€ [7, T]. Alors les deux fonctions x (-),æ (-) 
seront définies sur un même intervalle fermé [0, 7] et auront des 
valeurs limites identiques 


x (0)=x(0)=z, x (0) =x(0) = 0, (11) 


z(T)— (D=r(D 3 (T)=0. 
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Montrons que si |z | 1, alors x(+) = x(-) et, en particulier, 
l'inégalité T < T est impossible. Aïinsi nous aurons démontré 


l’optimalité de la fonction x (-). A cause de la symétrie du problème, 
nous nous limiterons à la commande c) (ou son cas limite a)). Lorsque 


z | 1, on peut prendre deux fois l'intégrale de l'inégalité 
lx(t) 1 et obtenir, en se servant de (11), 


2 ()—z(0 = | | (1— x (s)) ds dt >0, (12) 
5 


l'égalité ici étant possible seulement si l’on a la relation x (s) = 1 
dans tous les points de continuité de la fonction x, et alors x (t) = 
= x (t), tEÏ0, +]. 

D'une manière analogue, intégrant deux fois l'inégalité T () > 
> —1, on obtient 


TT 
2 (D—x(= | | (— 1x (s)) ds dt LO, (13) 
T + 
là aussi l'égalité n’est possible que si x (s) = —1 et x (t) = x (t), 


tElx, T1] 

En comparant (12) et (13), nous voyons néanmoins que x (rt) = 
— x (x), alors, comme nous l'avons déjà mentionné, x (t)= x (t), 
tE[0, TI. 

Remarque. L'égalité À, = | p, (T) | découle des relations 
(5) à (7) et ainsi l'égalité À, — 0 dans ce problème s’avère possible 
lorsque p, (+) s’annule pour t = T. Alors la fonction p, (+) n’est 
pas identiquement nulle (autrement tous les multiplicateurs de 
Lagrange] seraient nuls); par conséquent, à cause de l'égalité 
P2 (T) = 0, on voit que p, (-) ne peut changer de signe et il n’y a 
pas de changement de commande du tout. Ainsi, le cas À) = 0 cor- 
respond au mouvement le long des lignes de changement de commande 
AFO et BDO. 


1.6.4. Problème isopérimétrique classique et problème de 
Tchaplyguine. Le plus ancien des problèmes d’extrémum — le 
premier des deux dans ce titre — fut posé dans 1.1.1 et formalisé 
de diverses manières dans 1.2.4. En particulier, la formalisation 
(2), donnée dans 1.2.4, le réduit à un problème plus général, qui 
comprend en même temps le problème de Tchaplyguine. En partant 
de cette formalisation, nous trouverons maintenant la solution des 
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deux problèmes en suivant notre schéma usuel. Ainsi 
T 
| (xv — yu) dt —+ sup; (4) 
0 
r=u y=v (WvEA, æ(0)=x(T), y(0)=7y(T). 
L'ensemble des vitesses admissibles À sera supposé convexe fermé: 
borné dans R?°. 


. Exercice. Montrer que pour résoudre le problème posé il est nécessaire 
davoir 0€ A.Indication: on peut se servir du résultat de l'exercice 2 


dans 2.2.8. 


1 


1. S=-- 


T 
2. &= | Lat +u(x(0)—z(T)+v (y (O—v (Tr), 2) 
0 


L= — 0 (0 yu)+ p(&— u) + q(y—v). 


9. Equations d'Euler-Lagrange 


d : = 7 


: | (3): 
d D AG 
“y Ltl=0s—-q+5u-0. 
Conditions de transversalité 
P(O)=p(T)=h, g(0)=q(T)=v. 
Principe du maximum 
’ . L ; nn ee 
(O2 y D)u(+ (9 + 2 (6) v (= 
, un : Ê a 
= max ((p(—y ()u+(a(+z() v). (&) 


(u, t)EA 


4. Si l'on suppose que À = 0, alors il découle des équations: 


d'Euler-Lagrange que p (t) = Cte, q (t) = Cte et p? + 9° > 0, car- 
autrement les conditions de transversalité annuleraïent tous les. 
multiplicateurs de Lagrange. Aïnsi le principe du maximum se met. 
sous la forme 


pu(t)+qvu(t= max (pu+ qu), 
(u, d)EA 
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d’où l’on voit que (à (t), v (t)) appartient toujours à une même droite, 
à savoir à une des deux droites qui supportent l’ensemble À, per- 
pendiculaires au vecteur (p, q) (fig. 29). Par conséquent, 


x (t) = u(t) =u (0) — a (6) q, 


y (= v (t)-=v(0)+aœ(t) p, 


d’où, en prenant les intégrales, on obtient 


x (é) 


— x (0)-+u (0) &— | a (é) dt-q, 


: (2) 


t 


ÿ (= y (0)+v (0) t+ | à (E) dép. 
0 


En posant t — T dans (5) et en se servant des conditions aux 


limites x (0) = zx(T), y 


(P,4) 
((E), O(t) 





Fig. 29 


(0) = y (T), on s'assure que le vecteur 


6 —P) est proportionnel à (à (0), v (0)), 
d’où l'on voit ensuite, à partir de (5), que 
(x (&), y (£)) est toujours situé sur la droite 
qui passe par (æ (0), y (0)) parallèlement au 
vecteur (g, —p). Par conséquent, la courbe 
fermée {(x(t), y (t))}, 0 <t< T} dégénère 
(elle est contenue dans cette droite) et la 
surface qu'elle limite est nulle. (Montrez-le 
analytiquement en vous servant de l’ex- 
pression pour S calculée ci-dessus!) Par 
conséquent, cette courbe ne peut être 
optimale. 


0. Il découle de l'étape 4 que l’on peut poser À — 1. Alors, 


d’après (3), 


P+r=t - pO+ EL 25 = Cie, 


E > 


do œ 20 2 y Cte. 


En substituant ces expressions dans (4), on obtient 


(x (£)— a) v (6) — (y (t) —b) ü (8) = 


= max {(t(t)—a)v—(y(t)—b)u}. (6) 


(u, d)EA 
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Laissons maïntenant de côté le cas général et limitons-nous à 
deux variantes plus particulières. 
a)Problème isopérimétrique classique. lci 


A ={{u, vu +w<fi} 
et il découle de (6) que 


su 10, jH=-ro-e, 


= ((x (t)— a}? + (y (6 — 2)? 


(le produit scalaire des vecteurs (x — a, D — b) et (v, —u) sera 
maximal lorsqu'ils ont le même sens et le deuxième est de longueur 
maximale, i.e. de longueur 1). On tire de (7) que 


d 
2 (2) = 0 
i.e. sur la trajectoire optimale on a 


JE ( (0), y (6) = (( (4) — a) + (y (D —09 "= 
— max ((&(#)—a)v—(y (#5) —6)u)=R= Cte. (8) 


(u, vd)EA 


D'où l’on conclut que la trajectoire optimale est le cercle de centre 
(a, b) et de rayon R. Puisque la vitesse angulaire du mouvement Île 
long de ce cercle est sé à 


(ro y—-y—-bDD=—, 


et le point doit revenir au même endroit (en ayant peut-être 
effectué ___ rotations) à la fin du temps 7, on a 2nn — — - 


R 
et R—-— D . L'’aire limitée par la courbe trouvée sera alors égale à 
4 Ë nf, if : 
S — + | (av — yu) dt = —- | (ey — ya) dt=+ | ((x — a) y — 
0 0 0 | 
: R?®:.T T? 
THON 


Par conséquent, n — 1 (un seul tour du cercle a été effectué) et 
S — T?/4x. Remarquons que dans ce cas T est la longueur de la 
courbe. 
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b) Problème de Tchaplyguine. Ici 
À = {(u, v) | (u — uw) + 0° < V°}, 

(us, 0) est le vecteur de la vitesse du vent, V > | u, | est la vitesse 
maximale de l’avion. Pour résoudre le problème extrémal auxiliaire 
(x (#) — a) v — (y (té) — b)u —+ sup, 

(u — u9)? + vw? < VE, 


on peut, par exemple, se servir de la substitution u — u, + Ë, 
v — n et employer ensuite les mêmes considérations géométriques 
que dans le cas précédent. Ceci donne les équations 

x (t) —a 


À : a . 
2 ()=8(D)=u—- VAE, (0-00 =V EQTE, 


où maintenant l'expression 
R () = ((x (6) — a) + G (6) — 0)) 7° 
ne sera plus constante. Néanmoins, 


RO LE (2 (D — a) 2 (D + 0 (0 —0) ÿ (0) = 











de sorte que 
RE) — y (6) = ((x (6) — a)? + (y (0 +0) 7 — 20 y (8 =Cte. (9) 
Ainsi la courbe optimale est une ellipse d’équation 

(&—a) + (y — 0)" — 2 y = Cite. (10) 


De même que dans le cas précédent, on peut montrer que cette ellipse 


est contournée par la trajectoire (x (t), y (t)) exactement une seule 
fois. Remarquons que si la vitesse de l’avion aurait été inférieure à 
la vitesse du vent (V | u, |), il ne pourrait retourner au point 
initial (démontrez-le et comparez à l’exercice au début de ce para- 
graphe), tandis que la courbe (10) serait une hyperbole, i.e. serait 
non fermée. 

Remarque. Contrairement au schéma admis, nous avons 
passé sous silence la question de l'existence de la solution. Ce n’est 
pas par hasard : un simple renvoi au théorème de Weïerstrass est ici 
insuffisant. Indiquons brièvement une méthode de raisonnement 
possible. 
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Notons tout d’abord qu’on peut, sans perte de généralité, poser 
x (0) = y (0) = 0. 

En se servant du théorème d’Arzelà ([KF], pp. 104-105), on peut 
montrer que l’ensemble des paires de fonctions {(x (+), y (-))}, qui 
vérifient sur l'intervalle fermé [0, TI] la condition généralisée de 
Lipschitz et les conditions aux limites 

(QD, IQ) € A, Hat, Of HET, (11) 


ts t, —te 
z(O)=z(1=0, y(0)=y(T) =0, 


est compact dans l’espace C ([0, TI) x C ([0, T1. 

Ensuite, la fonctionnelle « aire » est définie sur cet ensemble ; 
c'est une fonction semi-continue par en bas. En appliquant la géné- 
ralisation correspondante du théorème de Weïerstrass, nous voyons 


que la solution (x (-), y (-)) existe. 
Enfin, les fonctions qui vérifient la condition (11) sont diffé- 


rentiables presque partout et (x (é), y (t)) € À. Il s'avère possible de 
généraliser le principe du maximum à cette situation et par consé- 
quent les raisonnements employés ci-dessus sont applicables à la 


solution (æ (-), y (-)). 


1.6.5. Problème du brachistochrone et quelques problèmes géo- 
métriques. Considérons la série suivante de problèmes élémentaires 
du calcul des variations classique : 


X1 


1 J(y(-))— | ya V1+y2dx—inf; y (to) = Yo ÿ (ti) = Ye 


(1) 


Cette série comprend plusieurs problèmes intéressants: pour 
4 —= 0 on obtient le problème des courbes de plus petite longueur sur 
le plan; pour œ — —1/2, le problème du brachistochrone (voir 
1.2.4) ; pour &« = 1, le problème de la surface de révolution minimale ; 
pour œ — —1, le problème des courbes de plus petite longueur sur le 
plan de Lobatchevski, dans l'interprétation de Poincaré [15, 
pp. 131-132]. 

L'intégrante f, = y V 1+y'2 dans les problèmes (1) ne dépend 
pas de x. 

Par conséquent l’équation d’Euler possède une intégrale d'énergie 
(voir 1.4.1) qui permet de trouver toutes les extrémales situées dans 
le demi-plan supérieur. 


2 à 4. y'a —f=Cte= y? (1+y"2) = DE. (2) 
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9. Considérons d’abord le cas des valeurs négatives de &œ: & — —f, 
B > 0. Alors 
B B 
D | 3 
Jan desde] " 


Effectuons le changement de variable 


B 
y28= D'sin2t= y D'P sin Pt dy — sin!/8- 1j cos t di. 





D!/ 
p 

En substituant les expressions obtenues dans (3), nous obtenons 
les relations suivantes (DUB — C\: 


t 
y=Csin!t Bt, x—C;+— | inl/B s ds. 


En particulier, lorsque B — 1/2 (le a on obtient la 
famille de cycloïdes qui s'expriment sous forme paramétrique (1—=—2t) 
de la manière suivante 


y(r, C; C)=+ ({— cost), zx(t, C, C)=Ci+(T—sin 1). 


Lorsque $ — 1 (le demi-plan de Poincaré), nous obtenons une famille 
de demi-cercles 
y (£, C, C,) = C'sin ét, x (£, L, Cr) =C, —Ccosit= 

+ (@ — CP + = C. 


En ve qui concerne la série « > O0,nousn’en résolvons que le pro- 
blème de la surface de révolution minimale. Nous avons, d’après 


(2), 
dy 
RL A 
V D?y?—1 . 
En nous servant de la substitution 
Dy=cht= Ddy=shtdt, V Dy—1—=sht, 


nous trouvons une famille de chaînettes à deux paramètres 
y= "ch (Dr+ Di). 


Ayant obtenu dans tous les cas une famille d’extrémales à deux 
paramètres (solutions des équations d’Euler), il faut maintenant 
choisir les constantes d'intégration de manière à remplir les con- 
ditions aux limites y (x;) = y; et passer à l'étape 6: l'étude des 
solutions trouvées et l'expression de la réponse. 
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Toutefois nous ne le ferons pasici. En nous rappelant que, de plus, 
nous avons à nouveau évité ici de discuter la question de l’existence- 
de la solution, le lecteur, à plus forte raison que dans le sous-para- 
craphe précédent, a le droit de déclarer: « Il y a quelque chose de 
pourri dans le royaume de la commande optimalel». 
En effet : 

Pour «& > 0 le problème (1) peut ne pas avoir 
de solution usuelle. Par exemple, dans le pro- 
blème de la surface de révolution minimale («—1), 
si les conditions aux limites sont symétriques 
(y (—xo) = y (to)), il faut chercher une extré- 
male symétrique, i.e. y — ch Dx/D. Toutes les 
extrémales de cette forme s’obtiennent de l’extré- 
male y — ch x par homothétie et, ensemble, elles 
remplissent seulement un angle, sans remplir le 
demi-plan tout entier (fig. 30). Par conséquent, 
pour un x, suffisamment grand, le problème, 
mettons, avec les conditions y (—x,) — y (xs) — Fig. 30 
— {, n’a pas de solution. 

Pour &« << 0 l’intégrante dans Le problème (1) tend à l'infini pour 
y —+ 0. Ainsi, par exemple, le problème du brachistochrone &« — —1/2, 
avec les conditions aux limites usuelles y (x) = 0, y (x;) > 0 
(voir 1.1.4), n’entre pas dans le cadre usuël. 

Pour obtenir une solution complète des problèmes de la série (1), 
un travail supplémentaire est nécessaire. 





CHAPITRE II 


APPAREIL DE LA THÉORIE DES PROBLÈMES D’EXTRÉMUM 


Le lecteur s’est familiarisé avec divers problèmes d’extrémum, 
avec les notions fondamentales et les idées générales qui s'y rappor- 
tent. Il a également pu acquérir une certaine idée des méthodes de 
résolution de ces problèmes. Nous passons maintenant à l'exposé 
systématique et suffisamment formel de la théorie mathématique 
appropriée. 

La généralité de la théorie développée, ainsi que sa simplicité 
relative, s'avèrent possibles grâce à un libre emploi de faits et de 
notions propres à des branches annexes des mathématiques, en 
premier lieu à l’analyse fonctionnelle. Leur exposition est donnée 
ici sous une forme commode pour la suite. La plus grande partie du 
chapitre est constituée par ce que l’on pourrait appeler « éléments de 
calcul différentiel ». 


$ 2.1. Notions préliminaires d’analyse fonctionnelle 


Dans ce paragraphe, nous décrivons ceux des faits de l’analyse 
fonctionnelle qui seront nécessaires par la suite pour la construction 
de la théorie des problèmes d’extrémum. Les démonstrations, que 
l’on peut trouver dans le manuel de A. Kolmogorov et S. Fomine 
[KF], seront généralement omises. 


2.1.1. Espaces vectoriels normés et espaces de Banach. Rappelons 
qu'un espace vectoriel X est dit normé si X est muni d’une fonction- 
nelle {[-||: À — R appelée norme qui vérifie les trois axiomes sui- 
vants: 


a) 

Hx>0, VrexX et [x =0 x = 0; 
b) 

Har|=|[a«llxi, VrexX, VaeR; (1) 
C) 


as + 2 Ia + [to lk Vas, 2 € ZX. 
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Parfois, pour souligner le fait que la norme est donnée dans l’espace 
X, nous écrirons ||-|[|x. 

Chaque espace normé devient métrique si on y introduit la dis- 
tance selon la formule 





E (Zi, Ze) = [| t — 2 | 


Un espace vectoriel normé complet relativement à la distance 
ainsi introduite est appelé espace de Banach. 


Exercices. Soit X — R?. Parmi les fonctions ci-dessous, quelles sont 
celles (et pour quelles valeurs des paramètres) qui donnent une norme dans X? 

LNG)= (Im lr + zx: 1P)/P, 0 << p <>; 

2. N' (x) = l'auti + Gyote | + | Got + G22o |; 

3. N' (x) = max {| auits + Gioto |, | Goity + Qgoto |}. 

4. Décrire toutes les normes dans R? (dans R?). 

5. Démontrer que toutes les normes dans R? (dans R?) sont équivalentes. 
(Les normes W, et NV, sont dites équivalentes s’il existe des nombres c > 0 et 
C0, tels que cN (x) << N, (x) L CN; (x), Vr EX.) 


L'ensemble X* de toutes les fonctionnelles linéaires continues sur 
X (l’espace dual de X) est un espace de Banach si l’on se donne une 
norme dans X*Ÿ en posant 


27 — SUD. GS D) 
I T* [La ne ns ) 


où (x*, x) désigne le résultat obtenu en appliquant la fonctionnelle 
DANS. 
Pour plus de détails, voir [KF], chapitre IV, $ 2. 


Exercice 6. Trouver les normes dans les espaces duaux des espaces 
décrits dans les exercices 1 à 3. 


Les espaces de Banach suivants joueront un rôle important par la 
suite. 


Exemple 1. L'espace C'(K, R”) des fonctions vectorielles 
continues x (:): À — R”, données sur un compact Æ, avec la norme 


Ix(-) = max {2 ()|. 
tEK 


L'espace C (X, R) sera désigné simplement par C (X). 

Exemple 2. L'espace C'([,,t,], R") des fonctions vectoriel- 
les r fois continüment différentiables x (+): [é,, t,]— R”, données 
sur un segment fini [é,, t] GR, avec la norme 


x) = max (zx () Il, - .., 109 (+) flo). 
L'espace CT ([é,, t.l, R) sera désigné par CT ([6,, t.,l): 


def 
C1 ([£o: t1], KR”) = Co: tal, R”). 


8—0237 
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Exercices. 


7. Démontrer que chaque espace normé de dimension finie est un espace 
de Banach. 

8. Démontrer que la boule unité d’un espace normé de dimension finie 
est un ensemble convexe fermé borné possédant un centre de symétrie et tel 
que l’origine des coordonnées est son point intérieur; et que réciproquement, 
pour chaque espace convexe fermé borné possédant un centre de symétrie et 
tel que l’origine des coordonnées est un point intérieur, il existe une norme rela- 
tivement à laquelle cet ensemble est la boule unité. 

à RUN un exemple d’un espace normé qui ne soit pas un espace de 
anachb. 


2.1.2. Produits d’espaces. Espaces quotients. Soient X et YŸ des 
espaces vectoriels. Leur produit À X Y, i.e. l’ensemble de toutes 
les paires (x, y), x € À, y € Y, se transforme en espace vectoriel si 
l’on y définit les opérations d’addition et de multiplication par un 
nombre suivant les coordonnées : 


(ti, Yi) + (Te, Yo) . (x + Les Yi + Yo»); œ (x, y) 7 (ax, ay). 


Si À et Ÿ sont des espaces normés, alors on peut introduire une 
norme dans le produit X X Ÿ, par exemple en posant: 


(x, 9) Ilxxy = max{ll x Îx, 17 Ir}. (1) 


Exercice. Vérifier que ||zllx + lv ly et Vie Uz + lg sont 
également des normes dans X XŸ, équivalentes à la norme (1). 


On a les lemmes évidents suivants. 

Lemme 1. Si X et Ÿ sont des espaces de Banach, alors X X Y 
est un espace de Banach. 

La démonstration est laissée au lecteur. 

Lemme 2. Chaque fonctionnelle linéaire À € (X X Y)* se met 
uniquement sous la forme 


(A (x, y)) = (x*, x) + (y, y}, (2) 


où a* CE XF et y* EE Y*. 

Démonstration. Posons (2*, x) = (A, (x, O)), {y*, y) == 
— (À, (0, y)). La linéarité de ces fonctionnelles est évidente, tandis 
que le fait qu'elles sont continues (<= bornées) découle des estima- 
tions suivantes: 


LG, æ) | KIA TG, ON = HAN I 


[Y*, y) II AÏI(O, y = HAN ZI 


L'’unicité de la représentation (2) est également évidente. M 
Puisque pour tous les x* € X* et y* € Y* la formule (2) déter- 

mine une fonctionnelle À € (X X Ÿ}*, nous avons obtenu une des- 

cription complète de l’espace (X X Y)*. Brièvement cette descrip- 
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tion est donnée par la formule suivante: 
(ARTE NT ONE 


Supposons maintenant que X est un espace vectoriel, Z son sous- 
espace. Posons x © x”, si x — x" € L. La relation ainsi introduite 
sera une relation d'équivalence (car il est évident que x © x, &, © 
D Lo + Lo © Ly Et T1 D Los Lo D Es M © %3) et donc ([KF|], 
chapitre I, $ 2) détermine une décomposition de X en classes d’équi- 
valence. Une telle classe pour la relation introduite ci-dessus est 
appelée classe d'équivalence (ou classe de contiguïté) relativement au 
sous-espace L. Dans l’ensemble de toutes les classes d'équivalence, 
on introduit d’une manière naturelle les opérations d’addition et 
de multiplication par un nombre ([KF], chapitre III, $ 4, p. 4); 
les axiomes d’un espace vectoriel sont alors vérifiés. Ainsi, l’ensem- 
ble de classes d'équivalence se transforme en espace vectoriel, appelé 
espace quotient de X par L et désigné par X/L. 

La classe d'équivalence x (x) à laquelle appartient l'élément 
x E X est la classe x + L. L'application x: X — X/L est linéaire 
et épimorphe !) (démontrer!). On l'appelle application canonique 
de X sur X/L. Il est évident que Z — Ker x. 

Soient maintenant X un espace normé et L son sous-espace. 
Posons 


NE gg 0 Îlx (3) 
ou 
Elle = D AL LES ARE lo + x” If. (3) 
TX— Xo—=$ 
x'EL 


Il découle immédiatement des définitions (3), (3) que l’opéra- 
teur x est continu (|| xx [| < {|| x ||) et que, pour chaque ËE € X/L, il 
existe un point x € X tel que 


at = Ë, [x <2IE Ilxyz. (4) 


Théorème sur l’espace quotient. Soient X un 
espace normé et L son sous-espace fermé. À lors la fonction ||‘] x/L: défi- 
nie par la relation (3), est une norme dans X/L. Si l’espace X est un 
espace de Banach, alors l’espace quotient X/L à norme ||‘|lxyr est 
également un espace de Banach. 

Démonstration. Il faut démontrer tout d’abord que la 
fonctionnelle ||-||x/. vérifie les axiomes d’une norme et ensuite que 
la complétude de X/L découle de celle de X. Démontrons la première 
assertion du théorème, i.e. vérifions les axiomes (1) de 2.1.1. 

Axiome a): ||6[lx/z > 0 (VE) puisque la norme est non 
négative dans X. Si Ë — 0, alors en guise de x € £ on peut prendre 
z = Vet l’on aura || 0 [|xyr — 0. Soit || Ë [xyr — 0. 11 découle alors 


l) Ie. applique X sur X/L tout entier. 
RE 
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de (3) qu’on peut trouver une suite {x,}, x, € E telle que || x, [| — 0, 
1.e. zx, —> 0. Puisque E est fermé, on a 0 € Ë, et E est donc l’ élément 
nul de X/L. 

Axiome b): Soit « € R. Alors, si xx = Ë, on a 


GE Try = nn y au ol [x Ru PARTNER SIE 


Axiome . 


IF É1 + El = Les Hate +r le inf eut tete ll< 
de x; EL 


D IE Te | + . || To + = |] 1 Lxyz + Il É lxyre 


Démontrons la deuxième es du théorème, ïi.e. le fait que 
X/L est complet. Soit {E,} une suite fondamentale dans X/L: 


Ve OIN(e):n>œN(Ee) = || Énim — En llxyr € 8, Vm >1 

Choisissons e, — 2* et des numéros n, tels que ny+4, > ny, 
N Ensm — En, 2, m0, &>> 1. Alors [| En, — En, || & 1/2, 
et, d’après (4), il existe des représentants x; € En tels que 
[xs — x, [| L1. D'une manière analogue, on peut construire des 
éléments {zh tels que [|tr — 2 20, x EE, k = 
— 3, 4,.,. La suite {x,}:_1 est fondamentale dans X (vérifierl), 
tandis que XÀ est complet par hypothèse. Par conséquent, la limite 


Zo = lim zx, existe. Considérons la classe &, — nx,. On a 
Ro 
Î Eng — Eo llxyz = nf [as —Xo— 2 x [tr —tollx — 0. 
X’EL R — 00 


Ainsi Er, + 60, mais alors on a également &, — &, puisque {£;} 
est fondamentale. Par conséquent X/L est complet. 


Exercices 


4. Soit X — C ([0, 11}, 0 Lu <T<...<Tm <L1, et supposons que 
le sous-  : L est tte par des fonctions z (-) . C ([0, 1]) telles que 
z (t;) = 0, 1, ..., m. Trouver l'espace quotient X/L et définir ||-|lx/1. 


2. lies les résultats de l'exercice 1 et démontrer que si F est un sous- 
ensemble fermé du segment [0, 1] et 


Lp= {r()EC((0, 1Dlr@=0,teF}, 


alors l’espace C ([0, 1])/LA est isométriquement isomorphe à l’espace C (F). 


2.1.3. Théorème de Hahn-Banach et ses conséquences. Dans la 
théorie des problèmes d’extrémum, un rôle important est joué par 
les théorèmes de séparabilité et certains autres faits provenant de 
l'analyse convexe. La majorité de ceux-ci sont des conséquences du 
théorème de Hahn-Banach, que l’on appelle souvent premier prin- 
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cipe fondamental de l’analyse linéaire. Vu que ce théorème se ren- 
contre dans tous les cours usuels d’analyse fonctionnelle, nous nous 
limiterons ici à son énoncé et à ses conséquences les plus impor- 
tantes. 

Dans cette section X est un espace vectoriel ou un espace vectoriel 
topologique !), R est la droite augmentée, i.e. R = R {J {—c, +oo}. 

Définition 1. Une fonction p: À — R est dite convexe et 
homogène si l’on a 


pix+y)<p(x) +p(y), quels que soient x, yEX, (1) 
p (ax) — ap (x), quels que soientrx EXetaæ>>0. (2) 
Exemples. 1) X est un espace normé, p (x) = || x ||. 

2) X est un espace vectoriel, Z un sous-espace vectoriel de X, et 
0 Hé 
AUS + oo, x 6 L. 
3) X est un espace vectoriel, Z,, ..., l, est.une famille de fonc- 
tionnelles linéaires sur X ; p (x) — max ({l,, x), . .., (lm» ŒN. 


Un exemple important s’obtient de la 
Définition 2. Soit À un sous-ensemble convexe de l’espace 
vectoriel À contenant 0. Sa fonction de Minkowski nA (-) se définit 
par l'égalité 
uA (x) = inff{{t—0]|x/teA) | (3) 


(s'il n’y a pas de t > 0 tels que x/t € À, alors uA (x) = +oo). 
Proposition 1. La fonction de Minkowski est non négative, 
convexe et homogène; 


{x lu4 (@) <1} € 4 Sfr | uA (0) <1} (4) 

Si X est un espace vectoriel topologique, alors uA (+) est continue 
au point O si et seulement si 0 € int À. 

Démonstration. Si uA (x) ou uA (y) est égal à +oo, 
alors (1) est vérifiée. Supposons donc que uA (x) < + et uA (y) < 
<T + co. Par définition, pour chaque e > 0 il existe des £ et s tels 
que 

O<Li<uA (x) +e/2 et xtEAÀ, 
OLs<uA (y) +e/2 et y/sEA. 


Mais alors 





x IA y S 
ts à t+s Te iLs S 
puisque À est convexe, on a donc 


LA (x + y) <i+s<uA (x) + A (y) + e. 
7) Au sujet des espaces vectoriels topologiques, voir [KF], chap. III, 8 5. 
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Vu que € était arbitraire, on a également (1). Ensuite, pour « > 0, 
on a 


uA (ax) = inf{t > 0 | œx/t € A} = inf{as > 0 | x/s € A} — 
— @inf{fs > 0 |zx/s E A} = auA (x), 


de sorte que (2) est vérifié. 

Le fait que uA (x) est non négative et la deuxième inclusion dans 
(4) découlent directement de la définition. Si uA (x) < 1, alors il 
existe un £ € (0, 1) pour lequel x/t € À, et puisque 0 € À et À est 
convexe, on à 


x=0.(1—t)++eie À, 


de sorte que la première inclusion dans (4) est vérifiée, 

Soit maintenant X un espace vectoriel topologique. On a alors 
les équivalences successives suivantes: uA (+) est continue au point 
0 — 


Ve > O0, AU, 30, VrEeU,, A <Ee< 
10,30, VreU,, ur << 
10,30, UV, <AO0EintÀA 


(ici U, et U, sont des voisinages du point 0 ; la deuxième équivalence 
est vérifiée à cause de l’homogénéité de uA (-) et puisque l’on peut 
poser U, = EU,). M 

Proposition 2. Pour que la fonctionnelle linéaire x* sur 
l’espace vectoriel topologique X soit continue, il faut et il suffit que 
pour une certaine fonction convexe homogène p (+) continue au point 0 
on ait, pour tous les x € X, l'inégalité 


{x*, x) < p (x). (9) 
Démonstration. On établit la nécessité immédiatement 
en posant p (x) = |{x*, x) |. 


{Supposons maintenant que (5) est vérifiée et p (x) est continue 
au point 0. Alors pour chaque & >> 0 il existe un voisinage U 3 0 
tel que p (x) << e pour tous les x € U. Puisque 0 E Uet0 = (—0)E 
€ (—U), il existe un voisinage W tel que 0E WEU NA(—Ù). Si 
x E W, alors x et —x € U, de sorte que, d’après (95), on a 

@*, z) Kp (x) <E, 
r*, —2) L p (—1) LE. 
Par conséquent, | {x*, x) | Le pour tous les x € W, i.e. x* est 
continu en 0. Il reste à remarquer qu’une fonctionnelle linéaire con- 


tinue en un point est continue sur X tout entier ([KF], p. 170). 
Théorème de Hahn-Banach ([KF], p. 129-132). 


Soit p: À — KR une fonction homogène convexe sur l’espace vectoriel 
X et supposons que l: L — KR est une fonctionnelle linéaire sur le sous- 
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espace L de l’espace X telle que 
4, x) L'p (x) pour tous les xE L. (6) 


A lors il existe une fonctionnelle linéaire À, définie sur X tout entier, 
qui est le prolongement de |, i.e. 


(A,x)= (I, x), x€£L, (7) 

et qui vérifie l'inégalité 
(A, x) Lp(x) pour tous les zxEX. (8) 
Corollaire 1. Soit X un espace normé et x) € X, xo Æ 0. 
Il 'existe alors un élément À € X* tel que || À [| = 1 et (A, xo) = [x ll 


Démonstration. Sur le sous-espace 
= rlreor, GER) 
donnons-nous une fonctionnelle linéaire / en posant 


G, axo) = a || to || (9) 
La fonction p (x) — || x || est convexe homogène et 
G, at) = alt <a llxo | = | ax | = p (axo), 


de sorte qu'on a l’inégalité (6). D’après le théorème de Hahn-Banach, 
l se prolonge à une fonctionnelle linéaire À sur X tout entier, et 
l’on a les relations (7) et (8). En se rappelant la définition de la 
norme d’une fonctionnelle (voir 2.1.1), on obtient de (8) 
IAI= sup (A, © < sup p(=1, 
[xll=1 lxil=1 

de sorte qu'en particulier À € X*, 

D'autre part, il découle de (7) et (9) que 

(À, &o) = (, to) = [rt 

et donc ‘la deuxième assertion du corollaire considéré est vérifiée ; 
en outre 


_ , To = 
IA 15: (A, 2) > (Qi || To D 1, 


d'où || A || = 1. 
On déduit immédiatement du corollaire 1 le 
Corollaire 2. Si l'espace normé X est non trivial (ie. 
X = {0}), alors l’espace dual X* est également non trivial. 


2.1.4. Théorèmes de séparabilité. Dans cette section X est un 
espace vectoriel topologique; X* est l’espace dual, consistant de 
toutes les fonctionnelles linéaires continues sur %X. 

Définition 1. Nous disons que la fonctionnelle x* € X* 
sépare les ensembles À EX et B EX, si 


sup (x*, x) < ini(x*, x), (1) 
xEA xEB 
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et sépare strictement À et B, si 


sup{x*, x) <inf(x*, x). (2) 
xEA xeB 


Du point de vue géométrique, l'inégalité (1) signifie que l’hyper- 
plan 


IT (aŸ, €) = {x | (x*, x) = c}, 


où sup (xr*, x) LcL inf (x*, x), sépare les ensembles À et B 
xEA xEB 

l'un de l’autre dans ce sens que À est situé dans un demi-espace 

(A+ (x, c) = {x | (x, x) < c}) déterminé par À (x*, c) et B dans 

l’autre (A _(x*, c) = {x | (x*, x) > c}) (fig. 81); l'inégalité (2) 





Fig. 32 


signifie que, dans ce cas, on peut choisir c de manière que À et B 
soient situés dans les demi-espaces correspondants et ne possèdent 
pas de points communs avec À (x*, c) (fig. 32). 

Premier théorème de séparabilité. Si les 
ensembles À & X et B & X sont convexes, non vides et disjoints, À 
étant ouvert, il existe alors une fonctionnelle linéaire continue non 
nulle qui sépare À et B. 

Démonstration. A) Puisque À et B ne sont pas vides, 
il existe des points a, € À, b, € B. L'ensemble 


C=(4—as)—(B — b;)= {x|r=a—as — b + b,, a € À, bE B}, 
est évidemment convexe (voir également la proposition 1 et l'exercice 
2 de 2.6.1), contient 0 et est ouvert (en effet, si zT=a— og — 
bi bet a € À, alors il existe un voisinage U, a EUCA,ona 
donc x E U — & = b, &C.Enoutrec = b, — aç é C, puisque 
dans le cas contraire b, — ay — Fee ao — b + b, pour certains 


a € A et b € BP, d'où l’on tire a = b € À NP, i.e. ces ensembles se 
rencontrent, contrairement à l'hypothèse. 
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B) Désignons par p (x) la fonction de Minkowski de l’ensemble C. 
D’après la proposition 1 (2.1.3), p (x) est une fonction non négative. 
convexe homogène et continue au point 0. En outre p (x) < 1 pour 
tous les x EC. 

C) Sur le sous-espace 


L= {x|zx=ac—=a(b, — a), x€R} 


définissons la fonctionnelle linéaire / en posant (!, ac) — ap (c). 
Alors pour & > 0 nous avons 

@, ac) — ap (c) — p (ac), 
et pour «a < 0, 

(@, ac) = ap (c) 0 < p (ac), 
puisque p (+) est non négative. Par conséquent, pour tous les x € L,. 
on à l'inégalité (!, x) < p (x) et, d’après le théorème de Hahn- 
Banach, / peut être prolongée à une fonctionnelle linéaire À telle que 
(A, ac) = {l, ac) = ap (c)}, a£€R (3): 

et 

(ALT pÜt), LCA: (4): 
Puisque p (+) est continue au point 0, il découle de (4) que la fonc- 


tionnelle À est continue (proposition 2, 2.1.3). 
D) Quels que soient a € À et bEB, on a 


A,a—b)= A,a—-a —b+b,) + (A, a — bp) <L 

<p(a— as —b + db) + (, (—1) (6, — ao)) LT — p (bo — A6). 
puisque a—a—b+bEcC, tandis que sur C p(x) < 1 ; en outre, 
on s’est servi de (4). Mais, pour 0<i<1, le point do = do)/t = 
— clt ne peut appartenir À l’ensemble C, car C est convexe é con- 
tient 0, tandis que le point c — b, — a, Ë C est situé sur [0, c/t]. 
Par conséquent 


p(b— ao) = int {> 0 Me EC} > 1. (5) 


On a donc (À, a — b) L'1 — p (b, — as) L 0 pour tous a E À et. 
bE B. Dans l'inégalité À. a) Z (À, b), on peut choisir a € À et 
b € B indépendamment, donc 


sup (À, a) inf (A, b). 
af A bEB 





En outre, d’après (3) et (5), on a (À, b, — ao) = p (b5 — 45) > 1 
de sorte que À =£ 0. Par conséquent, À sépare À et B. 
Remarque. Dans 1.3.3, nous avons déjà démontré le théorè- 
me de séparabilité dans le cas d’un espace X de dimension finie. 
Si l’on compare ses hypothèses avec les hypothèses du théorème que 
nous venons de démontrer, nous voyons que dans le cas de dimension 
finie on peut omettre la condition selon laquelle À est ouvert (le fait 
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qu’un des ensembles y consistait d’un seul point est sans importance). 
Les hypothèses du premier théorème de séparabilité peuvent être 
affaiblies : on peut demander seulement que int À - Get (int 4)" 
NB = @. Néanmoins, on ne peut pas se passer complètement de 
l'existence de points intérieurs, pour au moins un des deux ensen- 
bles. 


Exercices 
4. Soit À un ensemble convexe dans un espace vectoriel topologique X 
et int À Æ GG, x* E X*. Démontrer que 


sup (x*, t)— sup (x*, x). (6) 
xE A xe int À 


2. Déduire de (6) le théorème de séparabilité dans le cas où 4 et B sont 
.convexes et tels que int À Æ @, BZ G, B Nint À = g. 
3. Démontrer que, dans l’espace X = /,, l’ellipsoïde compact 


A=fr=f]el| D kaki <1) 
E=1 
et la demi-droite 
= {x = [x]la = 4k,, t>0} 
ne peuvent être séparés par aucune fonctionnelle linéaire continue, 
Deuxième théorème de séparabilité. Soient 
X un espace vectoriel topologique localement convexe (IKF], p. 164), 


À un sous-ensemble de X fermé convexe non vide et x € X un point 
qui n'appartient pas à À. Il existe alors une fonctionnelle linéaire con- 


tinue non nulle qui sépare strictement À et x. 
Démonstration. Puisque x é À et À est fermé, il existe 
un voisinage V 3 x tel que À NV = @. Puisque X est localement 


convexe, il existe un voisinage convexe B & V du point x. Ilest clair 
que B MN À = @ et, d’après le premier théorème de séparabilité, 
il existe une fonctionnelle non nulle x* qui sépare À et B 


sup {x*, x) L'inf(r*, x). 
xEA xEB 


[Il reste à remarquer que 


inf (x, 2) <(x*, à), 
xEB 


Car la borne inférieure d’une fonctionnelle linéaire non nulle zx* 


ne peut être atteinte en un point intérieur x de l’ensemble B. 
Définition 2. On appelle annulateur A! du sous-ensemble 

A d'un espace vectoriel X l’ensemble de toutes les fonctionnelles 

linéaires Z sur X telles que (?, x) = 0 quel que soit x € À. 
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Remarquons que Al est toujours fermé et contient 0 € X*. 

Lemme sur la non-trivialité de l’annu- 
lateur. Soit L un sous-espace fermé d'un espace vectoriel topologique 
X localement convexe, et L = X. Alors l’annulateur L! contient un 
élément non nul x* € X*. 


Démonstration. Choisissons un point quelconque x é L. 
D'après le deuxième théorème de séparabilité, il existe une fonction- 


nelle non nulle x* € X* qui sépare strictement x et ZL (L est un 
sous-espace d’un espace vectoriel, par conséquent, Z est convexe): 


sup (t*, a), à). (7) 
xEL, 


S'il existait un x, € L pour lequel (x*, x,) 0, alors, puisque 
ax, € L pour chaque & € R, on aurait 
sup(r*, x) > sup(x*, ax) = + 00, 
xEL acR 


contrairement à (7). Par conséquent ({x*, x) = 0 sur L, et donc 
1* C LA. 


2.1.5. Théorème de Banach sur l’opérateur inverse et lemme sur 
l’application inverse à droite. Le deuxième principe fondamental 
de l’analyse linéaire est le théorème suivant: 

Théorème de Banach sur l'opérateur in- 
verse. Soient X et Ÿ des espaces de Banach, A: À — Ÿ un opéra- 
teur linéaire continu. Si À est un monomorphisme, i.e. 


Ker À = {x | Ax = 0} = {0}, 
et un épimorphisme, ie. 
ImA= {yl|y= Ar, xEX} = Y, 


alors À est un isomorphisme entre X et YŸ, i.e. il existe un opérateur 
linéaire continu M = At: Y — X tel que 


MA =Ix, AM=ly. 


Démonstration ([IKF], p. 219). Nous nous servirons 
souvent dans notre cours du corollaire suivant du théorème de 
Banach : 

Lemmesur l'application inverse à droite. 
Soient X et YŸ des espaces de Banach, À un opérateur linéaire continu 
de X dans Ÿ qui est un épimorphisme. IT existe alors une application 
M:Y — X (en général discontinue et non linéaire) qui vérifie les 
conditions 

Â 9 M ee Ty, 


I M (y) IC IIy]Il pour un certain C > 0. 
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Remarquons qu’en vertu de la deuxième condition M est une 
application continue à l’origine. 

Démonstration. L'opérateur À est continu, par consé- 
quent son noyau Ker À, qui est l’image inverse du point zéro, sera 
un sous-espace fermé. D’après le théorème sur l’espace quotient 
(voir 2.1.2) l’ l’espace X/Ker À est un espace de Banach. Définissons 


l'opérateur À: X/Ker A—+ Y en posant ÀË — Ax sur la classe 
d'équivalence £ — nx. Cette définition est correcte 


Lis LT CE = 2 — 2 € Ker À = Ar, — Am. 
L'opérateur À est linéaire. Si nt = EE; 1 = 1, 2; Alors 
À (461 + be) = À (œits + Gore) — h . 
= air, + at = QiÂE, + a AË; 
L'opérateur À est continu : pour chaque zEË on a 
IAËT = I Az II AIX TE 
d’où l’on tire 


AE < IA nf Ia 11 A IE Her a 


Enfin, l'opérateur À est hijectif. En effet, À est un épimorphisme 
de même que A:VyEY, 3xE€X, Ax—y= pour E=n(x), ÂE—y. 
D'autre part, 


Ker À —0: Â£—0, nr—£—Ar—-0—1E€KerA—E—0. 


Ainsi nous avons démontré que l'opérateur À est un opérateur 
bijectif linéaire continu de X/Ker À dans Y. D’après le théorème de 
Banach sur l'opérateur inverse, il existe un opérateur continu 
inverse à À: M = At, M: Y —+ X/Ker A. 


Pour l’élément & — My trouvons, suivant (4) de 2.1.2, un élé- 
ment x —æx(E) tel que x EE et [x | L2]||E [lx/rer A. Posons 
M (y) = x (E). On obtient finalement 


(AM) (y) = A x (E) = RE = AÏy= y, 


IL (y) I=II x ©) IR2IIE ILxzer a = 2 1 MY [lxyxer à & 211 |11Iy 11. 


2.1.6. Lemme sur l’image fermée. Soient X, Y et Z des espaces 
de Banach, A: X + Y et B: X — Z des opérateurs linéaires conti- 
nus. L'égalité 

Cx = (Ax, Br) 


définit un opérateur linéaire continu C: X — Y X Z. 
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Exercice. Démontrer que si la norme dans Y X Z est définie par la 
relation (1) (voir 2.1.2), alors || € | = max {|| À ||, || B ||}. 


Lemme sur l’image fermée. Si le sous-espace Im À 
est fermé dans Ÿ et le sous-espace B Ker À À) est fermé dans Z, alors le 
sous-espace Im C est fermé dans Ÿ X Z. 


Démonstration. Le sous-espace fermé Y — Im À d’un 


espace de Banach Ÿ est lui-même un espace de Banach et À: À —- Y 
est un épimorphisme. D’après le lemme de 2.1.5, il existe une appli- 


cation inverse à droite à À, que nous noterons M: Y — X. Supposons 


que (y, z) appartient à l’adhérence de l’image de l'opérateur C. 
Cela signifie qu'il existe une suite {x, | n > 1} telle que y — 
— Jim Ax,, z = lim PBx,. Posons 


Lu 7 M (Ath — y) 


(y € Ÿ étant la limite d'éléments Ax, appartenant à Ÿ). Compte tenu 
des propriétés de M, nous obtenons 


A Ge TT ên) _…. Ath == (4 o M) (Ath DE y) — Y, 
[En 1 = M (An — y) I Cu At — y | 0. 


Par conséquent, BE, —0 et lim B (x, — &,) = lim Bx, — 2, 


ñn — 00 
D\ 


i.e. z appartient à l’adhérence de l'ensemble 
2 = {6 = Br | Ax = y}. 

Cet ensemble s'obtient par translation du sous-espace B Ker À: 

Us GE GG = Bar, Am = y, i=1, 2= 
Co — QG = Bts —t), À (rt — tu) =0— 6 — 

= 1 + (Ge — Gi); Cr € 24 Co — G1 € B Ker À. 
Mais B Ker À est fermé par hypothèse, donc l’ensemble X est éga- 
lement fermé. Par conséquent z, appartenant à l’adhérence de Y, 
appartient à > lui-même, il existe donc un élément x pour lequel 


Ax = y, Bx = 2. Ainsi (y, z) € Im C. 

2.1.7. Lemme sur l’annulateur du noyau d’un opérateur régulier. 
Soient X, Ÿ des espaces de Banach, À : X — Y un épimorphisme linéaire 
continu. Alors (Ker A)t — Im À *. 

Démonstration. A)Supposons quezx* € Im A* => x* — 
— A*y*. Alors, si x € Ker À, on a 

rade GTV: 2h = Qt; At) =0; 


i.e. Im A* C(Ker À)1. 


1) I.e. l’image du noyau de l'opérateur À par l'application B. 
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B) Supposons que 2* € (Ker A)t, je. Ax — 0 = ({x*, x) = 0. 
Envisageons l'application C: X— R X Y, Cx— (4{x*, x), Ax). 
L'image du noyau de À par l'application x* est zéro, i.e. un sous- 
ensemble fermé, et, d’après le lemme sur l’image fermée (2.1.6), 
Im C'est un sous-espace fermé de R X Y. Il ne coïncide pas avec 
R X Y puisque, par exemple, (1, 0) é Im C (en effet, si (æ«, 0) — 
(GT. 1), At), on a Ar 0e"; 2) = 0): 

D'après le lemme sur la non-trivialité de l’annulateur d’un sous- 
espace fermé propre (2.1.4), il existe une fonctionnelle linéaire 
continue non nulle À € (Im C}t C(R X Y}* et, en vertu du lemme 
sur la forme générale de la fonctionnelle linéaire sur un produit 


d'espaces (2.1.2), nous pouvons trouver un nombre À ER*=Ret 


un élément y* € Y* tels que 


Got AFy*, 2) = Rotr*, 2) + (y, Ax)={À, Cr) =0, Vz. 
Le cas À — 0 est impossible, car Im À — Ÿ et donc 
(y*, Az) = 0 = y* = 0 = A — 0. 


Par conséquent x* — A* (—y*/ho), ie. x* € Im A* et (Ker A)t € 
Im ÀA*. E 


2.1.8. Fonctions absolument continues. Dans la théorie de Îlx 
commande optimale, on rencontre constamment des équations diffé- 
rentielles de la forme 


x = pt, x, u (t)), (1) 


où u (-) est une fonction donnée, appelée commande. Dans cette situa- 
tion, quoique la fonction œ (é, x, u) est suffisamment bonne (conti- 
nue ou même différentiable), la commande w (+) ne l’est en général 
pas. Elle peut être continue par morceaux, et il est même commode 
de supposer parfois que uw (+) est seulement une fonction mesurable. 
Par conséquent, le deuxième membre de l'équation (1) peut être 
discontinu, et donc il faut préciser ce que l’on entend par sa solution. 

Remarque. Dans la présente section, la mesurabilité, 
l’intégrabilité, l'expression « presque partout », etc., sont entendues 
au sens usuel de Lebesgue ([KF], chapitre V, $$ 4, 5). Cette même 
règle restera en vigueur dans les autres parties du livre à de rares 
exceptions près, qui seront spécialement mentionnées: par exemple, 
dans les formules du sous-paragraphe suivant, l'intégrale est enten- 
due au sens de Stieltjes ou de Lebesgue-Stieltjes ([KF], chapitre VI, 
$ 6). Lorsqu'il s’agira de fonctions à valeurs vectorielles ou matri- 
cielles, chacune des composantes de la fonction devra posséder la 
propriété correspondante. Par exemple, la fonction x (+) = (x (-),... 
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, Zn (+) : Læ, BI— R° est mesurable et intégrable si chacune des 
fonctions numériques zx; (+) : [x, Bl—- R possède la même propriété 
et, par définition, 


8 B B 
À a) dt= {| 1 (6) dé, . | æn (E) dt). (2) 


Il est naturel de supposer (ce que nous ferons toujours) que l’équa- 
tion différentielle (1) avec la condition initiale x ({,) = x, est équi- 
valente à l’équation intégrale 


t(t)= t+ | p(s, z(s), u(s)) ds. (5) 


+ 
Qc 


Pour que ceci soit valable, x (-) doit être l'intégrale indéfinie de 
sa dérivée, i.e. il est nécessaire que la formule de Newton-Leibniz 
t 


x (E)— x (1) = | x (s) ds (4) 


T 


soit vérifiée. Les fonctions x (+) pour lesquelles on a (4) sont appelées 
fonctions absolument continues dans la théorie de l’intégration selon 
Lebesgue ([KF], chapitre VI, $ 4). Il est important de savoir que les 
fonctions de cette classe possèdent une autre définition équivalente 
que l’on peut vérifier effectivement. 

Définition. Soit X un espace vectoriel normé, À = [«, f] 
un intervalle fermé de la droite numérique. La fonction x (+): A X 
est dite absolument continue, si, pour chaque & >> 0, il existe un 
Ô >> Ô tel que pour tout système fini d’intervalles ouverts disjoints 
deux à deux (a, B:) la, B]l, k — 1,2,..., N, dont la somme des 
longueurs vérifie la relation 


N 
2 (Br — ax) < 6, (0) 


on à l'inégalité 


N 
2 Ie (Br) —æ(a)ll< 8. (6) 
Exemple. Une fonction x (-): A— X qui vérifie la con- 
dition de Lipschitz 
Ir) — x (I Klh—tl di, BEA, 
est absolument continue. En effet, ici il faut prendre Ô — e/K. On 


voit directement à partir de la définition, qu’une fonction absolu- 
ment continue est uniformément continue sur À (prendre NW = f). 
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Proposition 1. Soient X et Ÿ des espaces vectoriels nor- 
més et À un intervalle fermé de la droite numérique. 

Si les fonctions x; (+): A— X,i—1, 2, sont absolument continues 
et c; € R, alors la fonction c;x; (+) + c,x, (+) est absolument continue. 

S'i les fonctions x (-)}: A— Xet A (-): A—£ (X, Y) sont absolument 
continues, alors la fonction À (-}x (+): A— Y l’est également. 

S'i la fonction D(:): G—-Y vérifie la condition de Lipschitz sur l’en- 
semble # € G, tandis que la fonction x (+): A—- G est absolument con- 
tinue et im x(-) ={y|y =x(t), tE AC, alors la fonction 
® (x (-))}: À + Y est absolument continue. 

Démonstration. La première assertion découle directe- 
ment de la définition (voir également [KF], p. 337). Pour la démons- 
tration de la seconde assertion, remarquons que x (-) et À (-}, 
étant continues, sont bornées, de sorte que 


Maintenant, pour tout système d'’intervalles ouverts disjoints 


(ar, BA, k—1,2,...,N,ona 
p LA (Bn) & (Ba) — A (an) & (an) 11 < D IA (Bx) & (Br) — 
— A (Bu) & (a) 114 à I A (Ba) & (ax) — À (ax) & (on) || & 
< © 114 A (Ba) 1111 & (x) — 2 (aux) 11+ ÿ IA (Ba) — À (ox) 1111 æ (ax) 1 


< M : Ie (82) — 2 (on) 11 + Ma D IA (Bn) — À (ou) 


Choisissons Ô > 0 de façon que (5) implique les inégalités 


N N 
D enr  DIAGr)—-AGDI< 5e 
kR=1 kR=1 


Alors 
N 
R=1 


et donc À (-) x (+) est absolument continue. 
D'une manière analogue, si 


[D (21) — D (2) KA Nm —-r ll Vu, mew, 


on à 


N 
D [| D (x (Bx)) — D < à IT (Pr) — x (ax) | <e, 
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si Ô > 0est choisi de manière que (5) implique (6) où l’on a remplacé & 
par e/K. 

Le théorème principal de ce sous-paragraphe ne sera énoncé que 
pour un espace X de dimension finie, pour ne pas définir l’opération 
d'intégration dans un espace normé arbitraire (pour À — R” il suffit 
de sous-entendre (2)). C’est le seul cas qui nous sera nécessaire par 
la suite. 

Théorème de Lebesgue ([KF], p. 340). Si la fonction 
x (-): A R7 est absolument continue, alors elle est différentiable pres- 


que partout, sa dérivée x (:) est intégrable sur À et pour tous les t, 
TEANon a la relation (4). 


Si la fonction E (-): A — FR est intégrable sur À et t E'À, alors la 
t 


fonction x (t) = | E (s) ds est absolument continue et x (t) = £ (t) 
T 
presque partout. 

En vertu de ce théorème, nous appellerons par la suite une fonc- 
tion x (-) solution de l’équation différentielle (1) si elle est absolument 
continue et vérifie (1) presque partout. En effet, d’après le théorème 
de Lebesgue, ceci est suffisant pour que (1) entraîne (3). Réciproque- 
ment, si æ (+) vérifie (3) (i.e. en particulier &é — œ(t, (x (t), u (t)) 
est une fonction intégrable), alors, d’après le théorème de Lebesgue, 
x (-) est absolument continue et on a (1) presque partout. 

Pour conclure ce sous-paragraphe, notons une autre assertion dont 
l’analogue « numérique » est bien connu dans la théorie de l’inté- 
gration selon Lebesgue et dont la démonstration sera laissée au 
lecteur en guise d'exercice. 

Proposition 2. Une fonction mesurable x (-): À — R" est 
intégrable si et seulement si | x (+) | est intégrable. Dans ce cas, on a 


froal< (1e 1er. (7) 
LA A 


2.1.9. Théorème de Riesz sur la forme générale d’une fonctionnelle 
linéaire dans l’espace C. Formule de Dirichlet. Les définitions d’une 
fonction de variation bornée et de l'intégrale de Stieltjes seront sup- 
posées connues ([KF], chapitre VI, $$ 2, 6). Une fonction de varia- 
tion bornée v (+): [«, Bfl—- R sera dite canonique si elle est continue 
à droite en tous les points de l’intervalle ouvert (œ, B) et v (x) — 0. 

Théorème de Riesz ([KF], p. 365). À chaque fonction- 
nelle linéaire continue x* € C'([æ, BI)* correspond une fonction canoni- 
que de variation bornée v (+): [x, 6] — R telle que pour toutes les x (+) € 
EC (Ia, Bl on a 

B 


(at, æ(-))= | x (t) dv (t), (1) 


œ 
9—0237 
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et cette représentation est unique: si, pour toutes les x (+) E C ([x, BI) 
et pour une v (+) canonique, on a 
B 
| x (t) dv (té) —0, 
œ 
alors v (t) = 0. 
Ce théorème se généralise facilement au cas vectoriel. Soient 
e = (1,0,...,0),e, = (0, 1,..., 0),... les vecteurs unités de 
la base standard de R”. Un élément quelconque x (+) = (x, (*),... 
., Zn (+)) EC (læ, BI, R*) se met sous la forme 


n 


a(+) = 2 Tr (-) er 


Si maintenant x* € C ([x, B], R°)*, on a 
(r*, z(-)= 2 (r*, a (-)e)= 2 (té, tr (-)), 
où les fonctionnelles 4% € C ([x, Bl)* sont définies par les égalités 


(aË, 6 (-)) = (x*, 6 (-) ex). En appliquant le théorème de Riesz à x?, 
on obtient la représentation suivante 


n  B 
et, (= D) | a (0 du (D. @) 
kR=1 @ 
Une famille de fonctions de variation bornée v (+) = (uv, (+), ... 


., Un (-)) est appelée fonction à valeurs vectorielles de variation 
bornée (les valeurs sont des vecteurs lignes) v (-):[a, B]— R'*. 
Alors la formule (2) peut être récrite sous la forme 


B 
ce, æ(.))= | do (x (D, (8) 


œ 


qui coïncide avec (1) à l’ordre des facteurs près. De même que dans le 
théorème de Riesz, la correspondance entre x* et v (-) est bijective 
pourvu que la fonction v (+) soit « canonique ». 

Chaque fonction de variation bornée v (-): [æœ, Bl— R définit 
une mesure généralisée (où une « charge » [KF], chapitre VI, $ 5). 
L'intégrale de Stieltjes (1) est justement l'intégrale relativement 
à cette mesure. D'une manière analogue, une fonction à valeurs 
vectorielles de variation bornée v (+): [«, B]l— R'* définit sur [«, fi] 
une mesure à valeurs vectorielles relativement à laquelle l'intégrale 
est (3). La mesure qui correspond à la.fonction de variation bornée 


v (t) est généralement désignée par dv (t). 
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Si v. (-) et v, (-) sont deux fonctions de variation bornée sur 
l'intervalle fermé [a, B]l, alors on peut définir sur le carré [æ, B] x 
X [«, Blle produit de mesures dv, (+) X dv, (+), le théorème de Fubi- 
ni ([KF], p. 310) étant valable. En particulier, on a la formule bien 
connue pour la permutation des limites d'intégration (« formule de 
Dirichlet ») : 


B + B  B 

[élire Ja6}d,0= | {T7t Ja} a. 

œ œ œ S 

Lorsqu'on généralise la formule (4) aux fonctions à valeurs vecto- 
rielles (cette généralisation nous sera nécessaire par la suite), il faut 
faire attention à l’ordre des facteurs. Par exemple, si 
f(-,-):la, BI X La, Bl—+ Z (R', R”), 
uuC-)ila, Bl— R7, uv, (-y: la, Bl— R7*, 

il faut récrire la formule (4) de la manière suivante 


B t B  B 
fé H{fresa(s}=|(Td0f6 J}a4(4. 6 


$ 2.2. Eléments du calcul différentiel 
dans un espace vectoriel normé 


Le calcul différentiel est la branche de l’analyse mathématique 
qui étudie les propriétés locales des applications différentiables. A un 
niveau intuitif, la différentiabilité d’une application signifie que 
celle-ci possède une approximation locale par une application affine 
appropriée — la différentielle — ou, d’une manière plus générale, 
peut être approximée par une application polynomiale, ce qui per- 
met d'obtenir les informations nécessaires .sur les propriétés de 
l'application étudiée. Au même titre que l’analyse convexe, le calcul 
différentiel est un appareil de base de la théorie des problèmes d’extré- 
mum. 

Les fondements du calcul différentiel pour les fonctions scalaires 
sur la droite furent posés par Newton et Leibniz. Les problèmes du 
calcul des variations nécessitèrent la généralisation de la notion de 
dérivée et de différentielle aux applications des espaces de plusieurs 
dimensions et même des espaces de dimension infinie. Ceci fut 
réalisé par Lagrange au XVIIIe siècle et de nos jours plus complète- 
ment par Fréchet, Gâteaux, Levi et d’autres mathématiciens. 


2.2.1. Dérivée suivant une direction donnée, première variation, 
dérivées de Gâteaux ct de Fréchet, différentiabilité stricte. Il est 
bien connu que dans le cas des fonctions à valeurs réelles d’une seule 
9% 
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variable réelle les deux définitions suivantes: l'existence de la 
limite finie 


lim EH E) (1) 

h—0 . 

et la possibilité d’avoir la décomposition asymptotique pour À — 0 
F(c+h) = F (x) + F' (x h + 0 (h), (2) 


nous amènent à la même notion de différentiabilité. Pour les fonc- 
tions de plusieurs variables, et à fortiori pour les fonctions définies sur 
un domaine de dimension infinie, tout n'est pas aussi simple. La 
définition (1) et la définition de la dérivée partielle, qui la généralise, 
nous amènent à la notion de la dérivée suivant une direction don- 
née, de la première variation et de la dérivée de Gâteaux. En même 
temps, la généralisation de la définition (2) nous amène à la dérivée 
de Fréchet et à la différentiabilité stricte. 

Soient X et YŸ des espaces vectoriels normés, ÜU un voisinage du 


point x dans X et F une application de U dans Y. 
Définition 1. La limite 


Jim FERAI-FE), (3) 
A YyO 

si elle existe, est appelée dérivée de F'au point x suivant la direction hi 
on la désigne par F' (x : h) (et chez d’autres auteurs par (V,F) (x), 
DE @), vf (à). | 

Définition 2. Supposons que pour tout À € X la dérivée 
F' (x : h) suivant la direction h existe. L'application Ô,F (x : .): À —- 
—+ Ÿ définie par la formule Ô,F (x; h) — F'(x; h) est appelée 
première variation de l'application F au point x (on dit alors que la 
fonction } possède une première variation au point x). 

Si Ô+ (x, —h) = — Ô} (x, h) pour tous les k, autrement dit, si, 
pour tout À E X, on a la limite 


&F (x, h)— lim EE, 
À—0 
alors l'application k-- ôF (x : h) est appelée première variation sui- 


vant Lagrange de l’application F au point x (voir 1.4.1). 


Définition 3. Supposons que F possède au point x une 
première variation et qu'il existe en même temps un opérateur liné-- 
aire continu A € £ (X, Ÿ) tel que ô:F (x; h) = Ah. 
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Alors l’opérateur À est appelé dérivée de Gâteaux de l'application F 
au point æ; on le désigne par FG (x). 

Ainsi FG (x) est un élément de Z (X, Ÿ) tel que pour chaque 
h € X on a la relation 


F(æ + A) = F(x) + FR + 0 (À) (4) 


(quand À ÿ 0). 

Malgré la ressemblance extérieure des relations (2) et (4), elles 
diffèrent profondément. Comme nous verrons plus loin, même pour 
X — R?, une fonction différentiable suivant Gâteaux peut ne pas 
être continue. C’est que o (À), dans la décomposition (4), n’est pas 
nécessairement uniforme relativement à À. 

# 

Définition 4. Supposons que dans un voisinage du point x 
l'application F peut être représentée sous la forme 


F(x+hk)=F(x)+Ah+a(h)||# I], (5) 
où AEZ(X, Y) et 
lim |læ(k)||= {1 (0) ||— 0. (6) 
lAIl- 0 


Alors l'application F (+) est dite différentiable selon Fréchet au 
point x : on écrit alors F € D! (x). L'opérateur À est appelé dérivée 
de Fréchet (ou simplement dérivée) de l’application F au point T'; 
on le désigne par F'(x). 

Les relations (5) et (6) peuvent se récrire de la manière suivante 

F(e+h) = F (+ F'(œ)h + o (Ir |). (7) 


Il en découle facilement que la dérivée de Fréchet est bien définie 
(pour la dérivée de Gâteaux ce fait est évident, les dérivées dans une 
direction donnée étant uniquement déterminées), puisque l'égalité 
Ah — Ah || =o(|hI) pour les opérateurs A; EZ(X, Y), 
4,2; û 'est possible que si À, — A.. 

Enfin, en se servant du langage & — 6, on peut reformuler (5) et 
(6) de la manière suivante : pour chaque & >> 0, il existe un Ô > 0 
tel que pour tout À vérifiant || À ||  Ô on a l'inégalité 


IF @œ@+h) —F(a) — Ah l< el 1. (8) 
Ceci nous amène naturellement à la définition plus forte suivante. 
Définition o. L'application F est appelée strictement 


difjérentiable au point x (on écrit alors F € SD! (x)) s’il existe un 
opérateur AE £ (X, Ÿ) tel que pour tout & > 0 il existe un tel 


Ô >> 0 que pour tous les x, et x, vérifiant les inégalités [x, — x | << Ô, 
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| x, — x [| <<'Ô on a l'inégalité suivante 


LE (es) — F (&2) — A (mn — 2)1S 8 [la — ||. (9) 


En posant x, = x et Lr= x + k dans (9), on obtient (8), de 
sorte qu’une fonction strictement différentiable est différentiable 


également suivant Fréchet et À — F (x). 


La dérivée F’ (x) (de Gâteaux, de Fréchet ou la dérivée stricte) est 
par définition une application linéaire de X dans Ÿ. La valeur de 
cette application sur les vecteurs À € X sera souvent désignée par 


F" (x) lhl. Pour les fonctions numériques d’une seule variable (lors- 
que * = ŸY = R), l’espace Z (X, Y) = Z (R, R) des applications 
linéaires continues de R dans R s’identifie naturellement avec R 
(à la fonction linéaire y — kx correspond le coefficient angulaire k). 
C’est justement dans ce sens qu’en analyse élémentaire la dérivée en 
un point est un nombre (le coefficient angulaire de la tangente), 
alors que l’application linéaire correspondante de R dans R est la 


différentielle dy — F'(x)dx (ici, dx et dy sont les éléments de l’espace 
vectoriel R de dimension 1). 

Il est également connu que pour les fonctions d'une seule variable 
la définition 3 (ou la définition de la première variation selon Lagran- 
ge, qui coïncide avec elle dans ce cas) et la définition 4 sont équiva- 
lentes (une fonction possède une dérivée en un point si et seulement si 
elle possède une différentielle en ce point); ces définitions amènent 
à une même notion de dérivée, essentiellement celle qui fut intro- 
duite par Newton et Leibniz. La définition 2 est applicable ici aux 


fonctions qui possèdent au point x une dérivée à droite et une dérivée 
à gauche qui peuvent ne pas coïncider. Pour les fonctions de plusieurs 
variables (1 dim X << ), on emploie en analyse élémentaire la 
définition 1 (si » est un vecteur unité, alors (3) est la définition ordi- 
naire de la dérivée suivant une direction donnée ; si h est le vecteur 
de base de l’axe OX,, alors en remplaçant dans (3) À j O par À— 0, 
on obtient la définition de la dérivée partielle 0F/0x;) et la défini- 
tion 4 (l’existence de la différentielle totale). 

La généralisation de la notion de dérivée aux espaces de dimension 
infinie fut stimulée par les problèmes du calcul des variations. La 


définition de la première variation ÔF (x; h), sa notation et son appel- 
lation sont dues à Lagrange. Dans le langage de l’analyse fonction- 
nelle, cette même définition fut donnée par Gâteaux, par conséquent, 
la première variation suivant Lagrange est parfois appelée différen- 
tielle de Gâteaux. La condition de linéarité dans la définition de la 
dérivée selon Gâteaux est devenue généralement acceptée après les 
travaux de P. Levi. En analyse on emploie le plus souvent (dans le 
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cas de dimension finie, ainsi que dans le cas de dimension infinie) 
la définition de la dérivée selon Fréchet, néanmoins dans certaines 
situations (en particulier celles qui seront considérées par la suite) 
l'existence de la dérivée de Fréchet en un point est insuffisante. Il 
faut des conditions un peu plus fortes. C’est ce qui a mené à la notion 
de différentiabilité stricte. 

Proposition 1. Les définitions 1 à5 et la continuité d'une 
fonction sont liées par les implications suivantes: 


DO O CO = © 


tU | 


continuité continuité 
au point x dans un voisinage 
du point 


aucune desquelles ne peut être inversée. 

Démonstration. La partie affirmative de la démonstra- 
tion (i.e. la validité des implications) découle immédiatement des 
définitions, tandis que la partie négative (l'impossibilité d’inverser 
les implications) se démontre grâce à une suite de contre-exemples, 
dont la description détaillée est laissée au lecteur en guise d’exercice. 


1) 2 n'implique pas 3: f: R—+R, f,(x)}—=]x|. 


Au point x = 0 la variation est non linéaire. Ce même exemple mon- 
tre que la continuité en un point n implique la différentiabilité ni 
selon Fréchet, ni selon Gâteaux. 


2) 3 n'implique pas 4: f,:R?—R, 


À, L1= TL Lo >0, 
O dans les autres points. 


ACZE Lo) 7 


Cet exemple montre qu’une fonction peut être différentiable selon 
Gâteaux (au point (0, O)) sans être continue. 


3) 4 n'implique pas 5: fs: R—+R, 
4 x est rationnel, 
fs (x) = 0, zxest irrationnel. 


Au point x = 0 cette fonction est différentiable (selon Fréchet), 
mais n’est pas strictement différentiable, car elle est discontinue 
pour x Æ(. 
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Exercices 

1. Montrer que la fonction f,: R? — R, définie en coordonnées polaires 
sur R? par l'égalité 

fax) =r cos 3® (x —=(r1, xo) = (r cos p, r sin Œ)), 

possède au point (0, 0) une première variation selon Lagrange mais n’est pas 
différentiable selon Gâteaux. 

2. Toute fonction F € SD (x) vérifie la condition de Lipschitz dans un 
certain voisinage du point x. 

3. Pour toute fonction F € SD! (x) numérique (X = Ÿ = R), la dérivée 
F' (x) existe en presque tous les points d’un certain voisinage du point x. 


Proposition 2. Si les applications F;: U— Y,i — 1, 2, 
et A: U— £ (Y, Z), où Z est un espace vectoriel normé, sont difjfé- 
rentiables dans le sens d'une des définitions 1 à 5 (la même définition 
pour toutes les trois applications), alors: quels que soient les nombres 
t; ER, i—1,2, l'application F = a,F, + a,F, est différentiable 
dans le même sens au point x et l’on a 


F'(x)= af! (x) + PF, (x) 
ou 
F'(x;h)=uF! (x; h)+aF! (x; h), 
l'application 
D — AF; 


étant dif férentiable au point x dans le même sens et de plus 


D'(t; h)=A'(x; k) Fi(a) + A (0 Fi(x5 h). 


La démonstration découle immédiatement des défini- 
tions. M 

Dans le cas particulier où X = R et A: U—+ £ (Y, R) = Y*, 
D (x) = (4 (x), F; (x)) est une fonction numérique et cette dernière 
formule peut se récrire de la manière suivante: 


A (a), Fi) 13 = (4 (x), PF; (x) + (A (a), Fi), 


D! 


ce qui correspond parfaitement à la formule usuelle du calcul difïé- 
rentiel. 

Donnons deux exemples très simples de calcul de dérivées. 

1) Application affine. L'application 4A:X— Y d'un 
espace vectoriel dans un autre est appelée affine s’il existe une appli- 
cation linéaire A: À — Ÿ et une constante a € Ÿ telles que 


À (x) = Ax + a. 


Si X et Ÿ sont des espaces normés et A € £ (X, Y}, alors l'applica- 
tion À est strictement différentiable en tout point x et l’on a 


A" (x) = À. 
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Cette assertion se vérifie immédiatement. En particulier, si À est 
linéaire (a = 0), alors A’ (x) [k] = À (h) et la dérivée d’une applica- 
tion constante (A = 0) est nulle. 


Exercice 1. Démontrer la réciproque : si la dérivée (que l'on peut 
prendre dans le sens de Gâteaux) de l'application A: X — Y existe en chaque 
point x € X et elle est la même pour tous les x, alors À est une application 
affine. 


2) Application polylinéaire. Soient X et Y des 
espaces vectoriels topologiques et Z7 (X, Ÿ) l’espace vectoriel des 
applications continues polylinéaires des produits cartésiens X7 — 
= X X... X X dans Y. Rappelons que l'application IT (x1,. . ., &n) 


n fois 


est polylinéaire si pour chaque à l’application 
T; > II (4, ...) L;i_1) L;;, Li+4) ..., 4) 


est linéaire. Si X et Y sont normés, alors l’application II est continue 
si et seulement si elle est bornée, i.e. si le nombre 


HIT] = su PET (x4, ..., tn) (10} 


P 
Fax, :.., flxn 1 


est fini. Dans ce cas Z7 (X, Y) est un espace vectoriel normé à nor- 
me (10) pour lequel on a l'inégalité 


IT (a, +, 22) IS TN as ee Man fl (11) 


La fonction Q, (x) = IT (x, . .., x) est appelée forme de degré n 
(pour n — 2, forme quadratique; pour n — 3, forme ternaire} 
correspondant à l'application polylinéaire II. II découle de la défi- 
nition que 


Qn(E+R)= Qn (+ DIT... h,...,2)+O(IIP), (12) 
et par conséquent @, (+) est différentiable selon Fréchet en chaque 


point x et 


Q!, (x) [*] = D TE, 8 ,..., %) (13) 


(dans les deux formules (12) et (13) le i-ième terme de la somme con- 
tient la variable h à la i-ième place, tandis que les autres variables 


prennent la valeur x). Si l’application ITest symétrique, i.e. IT (x, . . . 
..., Æ) ne varie pàs pour toutes permutations des arguments x;, 
alors (13) se transforme en 


Qn (x) [k] = nil (, TR 1). 


138 APPAREIL DE LA THÉORIE DES PROBLÈMES D’'EXTRÉMUM [CH. IT 


En particulier, si X est l’espace réel hilbertien à produit scalaire 
(-1-), AEZ(X, ZX) et Il(x, 2) = (Axlx), alors Q, (x) = 
— (4x | x) — la forme quadratique de l'opérateur À — est difié- 
rentiable et 


Q!. (2) [A] = (4x | h) + (4h | 2) = (4x + A*z | h), 
puisque Q, (x) s’identifie naturellement avec le vecteur At + Ar. 
Par exemple, pour @, CÉRGPES EE la dérivée Q'(x) 
est égale à x. 


Exercice 2. Démontrer que Q, (x) = IL (x, ..., x), où IH € ZT (X, Ÿ) 
est strictement différentiable pour tous les zx. 


Un exemple plus compliqué est donné par l’assertion suivante. 

Proposition 3 Soit U<Æ(X, Y) l’ensemble des opé- 
rateurs linéaires continus À : X— Y pour lesquels on peut trouver un 
opérateur inverse A1E £ (Y, X). Si au moins un des deux espaces À 


ou Ÿ est un espace de Banach, alors U est ouvert, la fonction ® (4) — 
— Al est différentiable selon Fréchet en tout point À € U et l'on a 


D'(À)LA]= -- AH A". 
Démonstration. Si XÀ est un espace de Banach, alors la 


série > (—À"1H)" converge dans £ (X, À) pour LA || 11 4": [F1 
k=0 


et, comme on vérifie facilement, 
AH IS (AH À 2, 
LD CAN AT (A+) = Lx 
Par conséquent 
d+ayi= D (— À À (14) 


pour | ÆAl|<|| "11, de sorte que B(4, | A1[F)&U et U est 
ouvert. 
Si Y est un espace de Banach, alors (14) doit être remplacé par 


+= À Ÿ (HA Y. 
kR=0 


$ 2.2] CALCUL DIFFÉRENTIEL DANS UN ESPACE NORMÉ 139 


D'autre part, il découle de (14) que 
++ Æinâit=|] > (—À1r) À 1|< 
k=2 


1 À=2 118 11 & [2 


: = 0 (IA ||) 
1— 1} AIT AI 


< } (AIN A DA = 
R=2 
pour H —0, par conséquent, la fonction D (4) = À" est différen- 
tiable, sa dérivée de Fréchet s'exprimant de la manière suivante: 
D'(dI]=—AÂ1() A1 0 


Exercice 3. Démontrer que ® (4) est strictement différentiable en 
tout point À € U. 


2.2.2. Théorème de superposition des applications différentiables. 

Théorème de superposition. Soient X,Y,Z deses- 
paces normés; U un voisinage du point x dans X, V un voisinage du 
point y dans Y ; o:U—+ V,o (x) = y; VV Z; f=vop: U—-Z 
la superposition des applications q et 1. 

Si vd est différentiable selon Fréchet au point y, tandis que @ est 


différentiable au point x selon Fréchet (est différentiable selon Gâteaux, 
possède une première variation ou possède une dérivée suivant la direction 


h), alors f jouit au point x de la même propriété que œo et l’on a 


f'(@)=Y We (x) (1) 


OU 
f'(; h)= 4 () I’ (&; A). (2) 


Si + est strictement dif férentiable en y, tandis que œ est strictement 


difjérentiable en x, alors f est strictement dif férentiable en x. 
Démonstration. Considérons en détail les deux cas extrê- 
mes : le cas de la dérivée dans une direction donnée et le cas de la 
différentiabilité stricte. 
A) Par définition de la dérivée de Fréchet 


pu) = CU) + D’ (0) Lu — y] + (v) lu — y l 


lim @ (y) = à (y) —0. 


U—y 
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Si les limites suivantes existent 


’ 


+0 À40 
alors 
Lim LEA) EL pion PE GHMN—V() _ 
À40 À 40 À 


== Jim 


D @) Le G+ M) — y] + (p Gr + A) I pr + My 
A 40 À 


ie tH AR) —y 


Hate au ir] SÉHEE | 


=’ (@)l9" @; Mi+a@le (@; A)" () 1e" (; A), 
ce qui démontre (2). 

B) Pour simplifier les notations, désignons À, = ®° (x), A3 = 
= (y). Par définition de la différentiabilité stricte, quels que 
soient &, > 0, &, >> 0, il existe des 6, > 0, ô, > 0 tels que 
ei — 2 < 6, lre — 21 < 81 + 11 P (1) — P (2) — 41 (Gi — 

—Lo) [| K 81 [T1 — Zoe ll (6) 


ga — vll < 82, [ve — y << 8e => 11 D (31) — (ve) — A2 (ni — 
—.. Ya) IE Eo [| Y1 — Yo Il. (4) 


Pour chaque & > 0, choisissons 8, > 0 et e, > 0 de manière 
à avoir l'inégalité 
€ | A2 [+ 82 Î A1 Î + 8182 Ke; 


d’après ces nombres &,, &,, trouvons Ô, > 0, à, > 0 de manière à 
avoir les relations (3) et (4) et, enfin, posons 


Ô — min (8, Er) : 


Si maintenant || x, — x [<< et [||xe — x [<< ô, alors, en 
vertu de (3), on a 
lp (1) — @ (rc) 

< | p (1) — p (te) — A1 (ti — Lo) + I A1 Gi — 22) INK 
L Ex 21 — Le + NA: a — 2e = (NN 41 + &1) Hate le 0) 
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En posant dans cette inégalité tour à tour x, — x et Ta — ï, on 
obtient 

IL (ci) — p (@) I = [op (x) — y I (A1 1 + €1) Î K 02, 
de sorte que pour y; — @ (x;) on a (4). En se servant maintenant de (4), 
(5) et (5), on obtient 
If (1) — f (ta) — Aa: (mi — 29) I 

< | (op (&1)) —  (p (x2)) — A2 (p (1) — p (t2)) 1 + 
+ | 42 (p (ai) — D (t2)) — 4241 (ri — de) SK 

< Es | p (1) — p (2) I + I A2 IP (ri) — p-(re) — À (2) 

< 2 (| 41 [+ €1) ti — Le Î + 142 Ne a — 2 | = 

= (82 | A1 | + 8ste + [A2 Île) ai — 2e I € as — 22 


d'où on tire la différentiabilité stricte de f au point x. 


Si l’on pose x, — x, 4, — x + h dans les raisonnements ci- 
dessus, on obtient la démonstration du théorème dans le cas de la 
différentiabilité de @ selon Fréchet. Les autres assertions s’obtiennent 
en analysant l'égalité (2) déjà démontrée. M 

Le contre-exemple suivant nous montre que le théorème de 
superposition n’est pas valable en général si d n’est différentiable que 
selon Gâteaux. 

Exemple. Soient X — Ÿ — R?, Z=R; 


P (x) — (Pr (trs La)» Pa (Aus La)) = , Lo) ; 
À pour y=y?}, y >0, 
#4 (79 = | : 


O dans les autres cas 

(comparer au contre-exemple de la démonstration de la proposition 
4 dans 2.1.1). Ici o est différentiable suivant Fréchet au point (0, 0) 
et même strictement différentiable (vérifier!) ; la fonction 1 est diffé- 
rentiable suivant Gâteaux au point (0, 0), néanmoins la fonction 

Â pour x —=|x|>0 

2) = (boop) (x) = W(x?, x =| : 

OS QE O0 dans les autres cas 
n'est pas différentiable suivant Gâteaux au point (0, 0) (et ne possède 
même pas de dérivées dans les directions k = (1, 1) et k — (—1, 1) 

en ce point). 

Corollaire. Soient X et Ÿ des espaces normés, U un voisinage 


du point y dans Ÿ ,f: U—R une fonction dif férentiable selon Fréchet au 
point y etAE £L(X,Y). Alors fo A: AT(U)—R est différentiable 
selon Fréchet au point x — A” () et 


(fo A) (x) = A* (f'o À) (x). (6) 
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Démonstration. D'après les définitions, 


f'oA)@=f (An =f EL (F, R) = 7Y* 
et 
fo A) & =/f (AoA=f'(YeAEZ(X, R) = X*. 


Maïntenant, pour tout À € X, on peut écrire 
(A* (f' 0 A) (&), k)—((f" 0 A) (x), Ah) = f' (ÿ) [AR] — 
= (f'(ÿ)o A)h={f' (ÿ)e A, h)={(fo A)’ (x), h), 


ce qui démontre (6). 


2.2.3. Théorème de la moyenne et ses corollaires. Il est bien 
connu que le théorème de Lagrange pour les fonctions numériques 
d’une seule variable, également connu sous l'appellation duthéo- 
rème de la moyenne ou formule des ac- 
croissements finis, affirme que si la fonction f:la, bl—R 
est continue sur un intervalle fermé la, b] et différentiable dans l'inter- 
valle ouvert (a, b), alors il existe un point c € (a, b) tel que 


f (6) —f(a) = f(c)(b — a). (1) 


On vérifie tout aussi facilement que la formule (1) reste valable dans 
le cas d’une fonction numérique f (x) dont la variable appartient 
à un espace vectoriel topologique quelconque. 

Dans ce cas 


La, b]= {x|zx=a+t(b— a), 0<1<1}, 
et l’on définit d’une manière analogue l'intervalle ouvert (a, b), 


tandis que la différentiabilité peut être entendue dans le sens de 
Gâteaux. En posant 


nous réduisons la démonstration au cas d’une seule variable réelle. 
Pour les fonctions à valeurs vectorielles la situation est tout 

autre. | 

Exemple. Supposons que l'application f: R— R° est définie 

par l'égalité f ({) — (sin t, —cos t). Alors pour chaque t la dérivée de 

Fréchet (même la dérivée stricte) f” (£) existe (démontrer |!) : 


f' (t) [al = (cos t, sin ta = (a cos t, « sin.t). 
Mais en même temps, pour tout c, on a 
f (x) — f (0) = 0 Æ f° (c) [2x — O] = (2x cos c, 2n sin c), 


de sorte que la formule (1) n’a plus lieu. 
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On peut cependant remarquer que la formule (1) elle-même est 
beaucoup moins souvent employée en analyse que l'inégalité 
[f(b) —f(a) I M | b — a | (où M = sup |f’ (x) |) qui en découle. 
Nous montrerons maintenant que sous cette forme plus faible, 
l’assertion considérée est déjà applicable aux espaces normés arbi- 
traires. En suivant la tradition, on conserve pour ce théorème l’appel- 
lation 2 du « théorème de la moyenne » quoique, bien sûr, on devrait 
l’appeler «théorème d'estimation des accroissements finis ». 

Théorème de la moyenne. Soient X et Ÿ des espaces 
vectoriels normés et U = X un ensemble ouvert contenant le seg- 
ment [a, bl. 

Si la fonction f: U—- Y est différentiable selon Gâteaux en chaque 
point x € la, b], alors 


Il f (b) — j (a) IF Sup If" (c) Ib — al. (2) 
Démonstration. Choisissons arbitrairement y* € Y* et 
envisageons la fonction 
D) = Y*, f(a+t(b — a))). 


En chaque point du segment [0, 1] cette fonction possède une dérivée 
à gauche et une dérivée à droite 


D’ (t)= lim 2E=Y=TO . 
œy0 7 
— Jim (y*, f (a+(i— a) IEEE OS : 
œy0 DA 
— Ce jé f(a+t(b—a)—a(b—a)) —f RE _ 
œy0 œ 


= — (y, f'(a+t(b—a)1—-(b—01= 
—4{y*, f'(a+t(b—a)) [b— al), 
et d’une manière analogue 
D CE) = dim TO = (4, Ÿ' (a+ (b— a)) b— ap 


Puisque ces dérivées coïncident, la fonction ® (t) est différentiable 
(dans le sens usuel) sur [0, 1]; elle est donc continue sur cet inter- 
valle. D'après la formule de Lagrange, il existe un 8 € (0, 1) tel que 


Y*, f (6) — f (a)) = D (1) — D (0) = D" (0) — 
| = (y#, f' (a +.0 (b — a)) [b — a]). 
D'après le corollaire 1 du théorème de Hahn-Banach (voir 2.1.3) 


qui affirme que pour tout élément y € Y il existe une fonctionnelle 
linéaire y* E Y* vérifiant || y* || — 1 et-({y*, y) — [y ||, nous 
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pouvons choisir une telle fonctionnelle y* pour l’élément y = f (b) — 
f (a); nous obtenons 
If (b) — f (a) 1 = (y*, f () — j (a)) = 
= {y*, f'(a@+68(b—a))[b — ap} < 
<11y*]F 1 f (a+ 0 (b— a)) |] RENÉ Abe TE a 11, 
ce qu'il fallait démontrer. 
Envisageons quelques corollaires du théorème de la moyenne. 


Corollaire 1. Supposons que toutes les hypothèses du théorè- 
me de la moyenne sont remplies et À € & (X, Y). Alors 


DÉGE ENCENIR obeIREESNIOE Sel (5) 


Démonstration. Appliquer le théorème de la moyenne 
à l'application g (x) = f (x) — Ax. 

Corollaire 2. Soient X et Y des espaces normés, U un voisi- 
nage du point x dans X et f: U— Ÿ une application différentiablie 
selon Gâteaux en chaque point x € U. Si l'application x > fc (x) est 
continue (dans la topologie opératorielle uniforme de l’espace & (X, Y)) 


au point z, alors l'application f est strictement différentiable au point x 
(et donc différentiable selon Fréchet en ce point). 
Démonstration. D’après un & > 0 donné, trouvons un 
ô — 0 de manière que 
Hx—z]<ô—= 176 (x) — fe (x) <e. (4) 
Si Lai — x | << Ô et || Z— || 6, alors pour tout t—xi+t (x — 2x1) € 
€ [t1, Lo], 0<i<1, on à 
a |] 124 + (ro — 24) —2 [= [fé (m2 — 2) + (1 —0 (mi —2) II 
<iliz—2l+(1—0 mc <16+(1—1) 0 <6, 
de sorte que, d'après (4), [|f& (x) — fe (2) || <&. 
En appliquant le corollaire À pour A = fG (x), on obtient 


If Ce) —f () — 16 (0) (m2) 1 


< sup f(x) —fc (2) re llti 2 |, 
xE[X1, X2] 


ce qui implique la différentiabilité stricte de f au point x. 
Définition. Soient X et Ÿ des espaces normés. L’applica- 


tion F: U— Y définie sur un ouvert U & X est dite de classe CT (U) 
si elle possède une dérivée en chaque point x € U, l’application 
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x+-> F' (x) étant continue (dans la topologie opératorielle uni- 
forme). 

Le corollaire 2 nous montre qu'il n’est pas nécessaire de préciser 
de quelle dérivée il s’agit ici. On se sert constamment de cette re- 
marque lorsqu'on vérifie la différentiabilité de fonctionnelles con- 
crètes : on démontre l'existence de la dérivée de Gâteaux, on vérifie 
sa continuité, ce qui garantit déjà la différentiabilité stricte (et donc 
l'existence de la dérivée de Fréchet). 


Exercices. Supposons que dans les hypothèses du théorème de la 


Dons on a Y = R?, l'application x ++ fG (x) étant continue dans U « X. 
Alors 


1 
1) f (&)—f (a)= { fG (a-+t (b— a)) dt [b— a]. (5) 
0 


D] 


2) Il existe un opérateur À € Z (X, Y) appartenant à l'enveloppe con- 
vexe fermée (voir 2.6.2) de l’ensemble {f@ (x) | à € [a, b]} et tel que 


f@) — f (a) = À ( — a). 


3) Généraliser 1) et 2) au cas d’un espace de Banach arbitraire Y, en défi- 
nissant l'intégrale de (5) d’une manière appropriée. 


2.2.4, Dérivation dans un produit d’espaces. Dérivées partielles. 
Théorème sur la différentielle totale. Dans ce sous-paragraphe X, 
Y, Z sont des espaces normés. Envisageons d’abord le cas d’une 
application à valeurs dans le produit Y X Z,F:U—=Y X ZUcx. 
Puisque un point de Y X Z est une paire (y, z), l’application F con- 
siste également de deux composantes # (x) — (G (x), H (x), où 
G:U— Y, H:U-- 7. On déduit immédiatement de la définition 
l’assertion suivante. 

Proposition. Soient X, Y, Z des espaces normés, U un 


voisinage du point x dans X, G: U—+ Y, H: U—+ Z. 
Pour que l'application F = (G, H): U— Y X Z soit différentiable 


au point x dans le sens d'une des définitions 1 à 5 de 2.2.1, il est néces- 
saire et suffisant que G et I possèdent cette même propriété. On a alors 


F' (x) = (G’ (x), H' (x) 
OÙ 
F'(x;h) = (G' (x; h), H' (x; h)). 


Passons maintenant au cas où le domaine de définition de l’ap- 
plication F: U— Z est situé dans un produit d'espaces UE X X Y. 
Définition. Soient X, Y, Z des espaces normés, U un 


voisinage du point (x, y) dans X X Yet F: U— Z. 
10—0237 


146 APPAREIL DE LA THÉORIE DES PROBLÈMES D'EXTRÉMUM [GH. IT 


Si l'application x F(x, y) est différentiable au point x (suivant 
Gâteaux, Fréchet ou strictement), sa dérivée est appelée dérivée 


partielle relativement à x de l'application F au point (x, y) : on 
PS #n 0F # ES 

la note F,(x, y) ou (5 y). 

On définit d’une manière analogue la dérivée partielle relati- 
vement à y: 

RO An or #n #n 
Fy (x, Dee (x, y). 

Théorème sur la différentielle totale. 
Soient X, Ÿ et Z des espaces normés, U un voisinage dans X X Y et 
F: U—- Z une application qui possède en chaque point (x, y) € W des 


dérivées partielles F, (x, y) et F, (x, y) dans le sens de Gâteaux. 
Si les applications (& y) F,(x, y) et (x, y) F, (x, y) sont 


continues au point (x, y) € U dans la topologie opératorielle uniforme, 
alors F est strictement différentiable en ce point et l’on a 


F' (2, Y) LE, nl = Fa (x, y) [É+ PF, (&, y) nl. 
Démonstration. Ayant choisi un € > 0 quelconque, 
prenons Ô >> 0 si petit que le voisinage « rectangulaire » 
V = B (x, 6) X B (y, 6) ={(2, y) 1llz—2ll<6, y — y | < 5} 


du point (x, Ÿ) soit contenu dans Ù, les inégalités suivantes y étant 
remplies 


IF n— PF G Di<e, IF n—-F(@ ni<e (D 
Nous avons maintenant 
À — 
= F (œ, Va) — F (tn V2) — Fa (@, 9) Li — 22l — 
si F, (x, y) [y Te Yo] = [F (tr, Yi) — F (to, Y1) — 
— PF, (0, y) Lei — ll + LE (ca, 91) — F (ts, Va) — 
— y (x, y) [ya — Yall. 


On voit facilement que si les points (x,, y,) et (x, y.) sont situés 
dans V, alors on a également (x,, y.) € V et, en outre, les deux seg- 
ments [(z1, y1), (to, y1)l et [(to, Y1), (To, Y2)] Sont contenus dans V & 
c U. Par conséquent, les fonctions x F (x, 1) et y F (x, y) 
sont différentiables suivant Gâteaux : la première possède la dérivée 
F, sur [x,, x,l, la deuxième, la dérivée F, sur [y,, y,l. En appliquant 
le théorème de la moyenne à ces fonctions (sous a forme de l’inéga- 
lité (3) de 2.2.3 avec un choix approprié de A), nous obtenons en 
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vertu de (1) 
(ti, V1) EV, (to, Yo) EV HAS 


< sup {FX ( (E, y) —F, (2, 9) [le — 2e |} + 


+ sup {|F,(x, n)—F, (x, y) [111 vs — UPRES 


NEL Vs Y Yo] 


/ 


LE | Ti— Lo || + e || ya — Vol. M 


Corollaire. Pour avoir F € CT{(U), il est nécessaire et suffi- 
sant que les dérivées partielles F, et F, soient continues dans U. 

De même que la proposition 1, le théorème sur la différentielle 
totale se généralise sans difficulté au cas du produit d’un nombre fini 
quelconque d'espaces. 

Considérons encore le cas de dimension finie. Supposons que 
F:U— Rest définie sur un ensemble ouvert U & R'. 

Puisque, de manière naturelle, on a 

RER: XR ER: XR, 
Non mes ns ne” ne nm on pre mm 
m fois n fois 


on peut se servir aussi bien de la proposition 1 que du théorème sur 
la différentielle totale. Si l’on a 








Fi (x) FA (Lis 4325) h4 
F (x) = É _ Fa (x, sd) et ] ” : | 
Fm (2) ER C0) ka 
alors 
(r@t) | 
à \ 0Fo ,° 
F'(o [A] = | F2 @) A > ER LA DE 


. ee ee ee ee 














( = (&) _ 1 (2)) h, 
= RE (2) 
<= (x) - (x) | ha 


10% 
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La matrice d'ordre mXn 
Ô0F ,° 0Fs ,° 
5e @ = (5 @) 
est appelée matrice de Jacobi de l’application F au point x. On voit 


évidemment que c’est tout simplement la matrice de l'opérateur 


linéaire F (x): R7— R7, écrite pour les bases standards de R” et 
de R7. 
En analyse classique, on écrit généralement 


dx \ 





dx, / 


et la formule (2) se met sous la forme 


n 
A  0F 
j=1 
L'’assertion démontrée dans le présent sous-paragraphe est une 
généralisation du théorème bien connu qui affirme que l'existence de 
dérivées partielles continues est une condition suffisante pour la 
différentiabilité d’une fonction de plusieurs variables. 


2.2.5. Dérivées d’ordres supérieurs. Formule de Taylor. Dans ce 
sous-paragraphe X et Ÿ sont des espaces normés, ÙU est un sous- 
ensemble ouvert de X. La différentiabilité est partout entendue dans 
le sens de Fréchet. 

Si l'application f: U— Y est différentiable en chaque point 
x E U, alors l'application f’ (x): U— £ (X, Y) est définie. Puisque 
L (X, Y) est également un espace normé, on peut s'interroger sur 
l'existence de la dérivée seconde 


J(&) = FY'(@) EL (X, L(X, Y)). 


On définit par récurrence les dérivées d'ordres supérieurs : si f(*-D{x) 
est déjà définie dans U, alors 


FACE (D EL Rss DAT) 2). 
Lam, me” 
n fois 
Définition 1. Soit f: U— Y. Nous dirons que f(") existe 
au point x € U, si dans un certain voisinage de ce point les dérivées 


f' (2), f(x), ..., {0-0 (x) existent ainsi que f() (x). 
Si f(9 (x) existe en chaque point x € U et l'application x 
-> f() (x) est continue dans la topologie uniforme (engendrée par la 
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norme) de l’espace Æ (X, ..., Æ (X, Y) ...), alors f est appelée 
application de classe C” (U). 
Par la suite, nous aurons besoin de certaines propriétés des appli- 
cations polylinéaires continues (voir l’exemple 2 de 2.2.1). 
Proposition 1. Les espaces normés £" (X, £7" (X, Yet 
LM (X, Ÿ) sont isométriquement isomorphes. 
Démonstration. Si ne£"(X, £"(X, Y)), alors 
H (ty, . . ., Tn) € LT (X, Yet l'égalité 


IT (T1, + Ln;: Th +1) . + Lu) ee 
Eh 5 us Lol lien sd deal (1) 


détermine une application II polylinéaire de l’espace X7tm — 

= X X... x X dans Y. Inversement, toute application II 
Le mens sms 7 

; ntm fois ’ se — : D ol 

détermine, suivant l'égalité (1), une application x polylinéaire 

de l’espace X®— X X...X X dans l’espace des applications 


n fois 
polylinéaires de X”* dans Ÿ. Il reste à remarquer que 


| ET || = SUP IL IT (x, ….) Li) I] = 
IX: IS 
In am IS 
— Sup SUD, Rss mile cmt 
x lt UIxnal<t 
lent  Urniml 1 
— sup fln(z, ...,2,)[]=||xi. 
IX: 1 LI 
x, 11 


Corollaire 1 ÆZ(X, £(X, ..., Æ(X, Y)...)) est 





n fois 
isométriquement isomorphe à L" (X, Y). 

Ainsi, on peut supposer que f(® (x) € £" (X, Y}). La valeur de 
cette application polylinéaire sur les vecteurs (£,, ..., E,) sera 
désignée par f(x) [E,,..., 6,1. D'après la définition par récurren- 
ce, on a 


17 (to) [Et CE En] GE 


— lim A (to + QE) 162» ..., En] —f(r-1 (xo) [Ë2 ..) En] 
œY0 œ 


Pour un choix arbitraire de II € Z" (X, Y) et pour des indices 
différents (i,, . .., i:), chacun desquels prend une des valeurs 1, 
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2,..., n, désignons 


Hé. ip Ci hu. ho) =, 14,2) [ei ny, PE PE à 
XX, it, ss îpe 


Proposition 2. SilIEZ£"(X, YjetQ (x) = I(x,...,x), 
alors 


Q" (x) Lil — à (x; ha), 


Q"(x) hi, ke] — 2 > [;;(x; hs, ho), 
ii (2) 


OP mme. 2 Ile), 


QU (x) =0 si k>œn 


(dans la formule pour Q(”), on prend la somme sur toutes les permu- 
tations des indices). 

La démonstration de ces formules s'obtient par un calcul direct 
(comparer également à l'exemple de 2.2.1). Remarquons que (2) 
implique que chacune des dérivées Q0) est une fonction symétrique 
de (h,,..., k). Nous verrons par la suite que ceci n’est pas un fait 
du hasard. 

Proposition 3 Si l'application [IE £"(X, Y) est 
symétrique et Q (x) = IL (x, ..., x) = 0, alors IH = 0. 

Démonstration. Posons 


P (as... ên) = Q (ti +... Hit) = 


= > li, … ti [(x:,, .., Ti) = 
Â1, “Je es in 
/ 
=. 2. mie) 

K1 œ œ 

— <i LUN... à M (x nr li oaus Do ci ln) 

Sa.—=n œ1 fois Xn fois 
[A 
où dans >, nous avons regroupé les termes dont les indices i,,...,iù 


possèdent la propriété suivante: &, d’entre eux sont égaux à 1,... 
.., on d'entre eux sont égaux à n, V, ...,, étant le nombre de termes 


de cette somme (dans la dernière égalité nous nous sommes servis du 
fait que IT est symétrique). 

Par hypothèse, p (4,,...,t,) = 0 et donc tous les coefficients de 
ce polynôme sont nuls. En particulier, le coefficient n! IT (x,,...,æ:) 
du terme tt, ...t, est nul. M 
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Théorème des dérivées mixtes. Si la dérivée 


seconde f” (x) de la fonction f: U— Y existe, alors on a pour tous les Ë, 
nEX 


f" (LE, nl = f" (@) In, £l (3) 


Démonstration. D'après la définition de la dérivée 
seconde 


fa—-f oo =(4/)@Ok-+axlz-z ll 
où a (x) E £ (X, Yet 


lim @ (x) = à (x) = 0; (4) 


XX 


a “ suffisamment petit et x suffisamment proche de x, la fonc- 
1on 
pr) =f(x+n) — f(x 
est définie et 
(a =f'(c+n)—f'(o) = (a+) —f (@ (1 (© —f' (©) = 
= (f)" (@) Le +n— 24e (c+n) r+n—27 || 
—(f)" (ox (x) xx = 
= (f)" (@) Int + (+) 2 +nl-a (rit 


En particulier 


p' (x) = (f°)" (&) En] + @ (x + n) [ln I, (5) 


et donc 
ga—-po=. 
=af(c+n)lir-zx+nfl—a(x)rz-zfl— «(x + n)ln ra 
D'après (4), pour tout & > 0 il existe un & > 0 tel que 

Ier —zi<ô lo (I<e, (7) 
d'où l’on tire en vertu de (6) 
zx < 6/2, 


In 8/2 1" (&) — 9 @)II<2e(Iz—z+ ln 
Pour des & et n suffisamment petits, la deuxième différence 


las 


An, D =f(+E + mn —f (+8 —f(& + mn) + /@ (9 
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est définie, de sorte que l’on peut obtenir, en appliquant (5), (7) 
et (8), 


EU < 6/2, nil 8/2= 1] A (n, #) — f(x) In,  11= 
= ||p (&+ 8) — p (2) —((f)" (@) nl) ET 11 = 
= [pc +8 —p (2) —@' (2) LE +0 (5 +0) [En 
sn Or G@) HET (+0) HEIN 
€ 2e (EI + In DIE 1 + elt E IL n I 3e(LE + Un ID NE 


En remplaçant Ë, n par t£, in, où maintenant E et n sont des va- 
leurs fixes arbitraires, tandis que t € R doit être petit, nous obtenons 
l'inégalité 

LA (én, 26) — #f"(2) In, EN 8e8 (ILE 1 + In IDE Il. (40) 

En changeant de place & et n dans les raisonnements ci-dessus, 

nous obtenons également 
IA GE, ên) — #7" (0) (6, nl << 3e (EN + In) Int (9 


Mais À (in, t£) — A (TE, in), puisque la deuxième différence (9) 
est symétrique relativement à & et n, tandis que (10) et (11) amènent, 
après simplification par {?, à l'inégalité 


If" (@) In, 1 — f” (a) LE, nl 8e (IE 1 + In 12. 


& étant arbitraire, on obtient (3). 
Le titre que nous avons donné à ce théorème provient de l’analy- 
se classique et du théorème correspondant qui affirme l'indépendance 


2 Lé Q Q 2 2 
de la dérivée mixte de l’ordre de différentiation : Pie 7 
0xÔy OyOx 








(pourquoi ?). 

Corollaire 2. La dérivée f(") (x) (si elle existe) est une fonc- 
tion polylinéaire symétrique. 

Démonstration. Pour n — 2, c’est l’assertion du théo- 
rème que nous venons de démontrer. Ensuite il faut raisonner par 
récurrence en se servant des égalités 
(GED) (x) LED In, ., ml = 

= {09 (x) LE, Mas + + Mn = 
= ((0-2)" (x) LE, mal) Mes Mn. 


L'hypothèse de récurrence, appliquée à la première égalité, montre 


Lai 


l'invariance de f(9 (x) LE, 1, . . ., Mn 11 relativement à toute permu- 
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tation des variables n;, tandis que le théorème 1 et la deuxième éga- 
lité impliquent l'invariance relativement à la transposition de & avec 


n.. Ceci est suffisant pour démontrer la symétrie de f() (x). HE 

Si l’on passe de la fonction symétrique polylinéaire à la forme 
correspondante (voir l’exemple de 2.2.1), on obtient la différentielle 
à la place de la dérivée. 

Définition 2. 

sh) =) le se 4 

Exemple. Si Q(x) = IT(x, ..., x), où IE £"(X, Y), 

alors, en vertu de la proposition 2, 


dM'O(0;h)—0 pou ken 
d'Q (0: À) = 1 Q (h). 


Lemme. Si la dérivée f(”) (x) existe et f (x) = (0, jf’ (x) =0, Tv 
..., f00 (x) = 0, on a 


et 


— +R 
lim-jrgm  —0 


Démonstration. Pour n — 1 l’assertion est valable 
d’après la définition de la dérivée. On continue le raisonnement par 


récurrence. Soit r > 1. Posons g (x) = f’ (x). Alors g (rx) = 0,... 


RS des (x) — 0 et, d’après l'hypothèse de récurrence, pour tout 
e > 0 il existe un Ô = 0 tel que 


Lg +) <e || Mt avec [|A || < 6. 
Maintenant, d’après le théorème de la moyenne, on a pour [|A [| Ô 
fG+h = G+h)—f (@)—f @ AI 

< sup If (@+h)—f'(&1IlIA I = 

h1€[0,h] 
— sup [g(r+h)lIAIS sup el tNAl—=elAl". M 
€[0, h] h1€[0,h] 


ha 
Théorème sur la formule de Taylor. Si 
4 (x) existe, alors 
FR 4h) = f Co) + df (5 24 + dj (eh) on (R) II À |, 
où 
lim @& (h) =: «, (0) — 0. 
h=0 
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Démonstration. Considérons la fonction 


gE)=f(&+E—f (D —df (x; D—...——"d'f(c: E),. 


En nous servant de l’exemple envisagé ci-dessus et de l'égalité 


(rs ED =fP (DIE ..., EL, FO (DEL X, Y), 


nous obtenons 


de (0; R)=d'f(&; k)—(k1d*f (x; h))=0. 


En appliquant le corollaire 1, d’ après lequel g(*) (0) est une fonc- 
tion symétrique appartenant à à L°(X, Y); et la proposition 3, 
selon laquelle toute fonction symétrique s’annule dès que la forme 
correspondante s’annule, nous voyons que g (0) —0,..., gt (0) — 
— 0. D'après le lemme, || g (£) [| = 0 (|| | Je, et l’assertion du théorè- 


me est démontrée ; en outre, &, (h) — pour À 0. 


NU 


| Exercice. Si f(®) (x) existe dans un voisinage en étoile du point x, 
alors 


(n —1)! 
n 
< sw Ifm@ IT, 
cElx, &+h] 


lrG+n—1 Ga Gi nr G » | < 


] 1 G+n—1 @ a (23 k)— dn-1f (x; h) | < 


< sup mom e 


cE[X, X+h] 


Indication. Une des méthodes de solution possibles est la suivante : 


pour n > 1 la dérivée f’ (x) est continue dans un voisinage du point x et l’on 
peut se servir de l'égalité 


1 
140) @)= | f' (eo) dt 1h] 
0 


(voir l'exercice de 2.2.8). 


Les inégalités obtenues dans ce problème sont les généralisations 
de la formule classique de Taylor à terme résiduel sous la forme de 
Lagrange, tandis que le théorème lui-même nous donne cette même 
formule à terme résiduel sous la forme de Péano. 

La démonstration de l'existence des dérivées d'ordre supérieur 
dans le sens de Fréchet pour les applications concrètes amène souvent 
à des calculs compliqués ; par contre, le calcul des dérivées ou, plus 
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exactement, des différentielles, i.e. des formes homogènes corres- 
pondantes, s'effectue en général beaucoup plus facilement. Le plus 
souvent, on le fait en se servant de la notion de variations selon 
Lagrange. 

Définition 3 La fonction f — U— Y possède une 


n-ième variation selon Lagrange en un point xEUSsi pour tout k€ X 
la fonction œ (x) = f (x + œ&h) est différentiable au point &« = 0 
jusqu’à l’ordre n inclus. Dans ce cas, l’application k —- Ô"f (x : h) 
définie par l'égalité 


"f (23 0) = Q (0) = f (5 ah) lue (2) 





est appelée n-ième variation de f au point x. 
Corollaire 3. Si f(9 (x) existe, alors f possède une n-ième 
variation selon Lagrange au point x, et l’on a 


6"f (x; h) = d'f(x; k) = f00(x) [h, . .., Rl. (13) 


La démonstration s'obtient facilement par récurrence en 
se servant de la formule de Taylor, puisque cette dernière nous donne 


f(z+ah)= f(x) + df (x; h)+ ... + d'f(&; k)+o(a"). 


Ainsi, si l’on sait à priori que la dérivée f( (x) existe, on peut 


calculer d”f (x : h) en se servant des formules (12) et (13) et du calcul 
différentiel pour les fonctions de variable scalaire, ce qui est, bien 
entendu, beaucoup plus simple. En vertu de la proposition 3, la 


différentielle d"f (x; hk) détermine de façon unique la dérivée f(" (x) 
(i.e. la fonction polylinéaire). 

La réciproque est évidemment fausse: une fonction peut avoir 
une n-ième variation sans posséder de dérivée de Fréchet (0). 

Nous laissons au lecteur le soin de trouver les propriétés supplé- 
mentaires que doit posséder la n-ième variation pour que l’assertion 
analogue à la condition suffisante de différentiabilité soit satisfaite 
(corollaire 2 de 2.2.3). | 


$ 2.3. Théorème des fonctions implicites 


La généralisation du théorème classique sur les fonctions implici- 
tes démontrée dans ce paragraphe s'applique avec succès dans diver- 
ses branches de l’analyse. Nous aurons l’occasion de nous en con- 
vaincre par la suite. 
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2.3.1. Enoncé du théorème d’existence des fonctions implicites. 
Soient: X un espace topologique, Y et Z des espaces de Banach, W un 
voisinage du point (xo, yo) dans X X Y, Ÿ une application de W dans Z 
el ro Yo) = Zo- 

l : 


1) l'application x —Y (x, yo) est continue au point xs; 

2) il existe un opérateur linéaire continu À: Y — Z tel que pour 
tout & >> 0 il y a un nombre Ô >> 0 et un voisinage Æ du point x, possé- 
dant la propriété suivante: la condition x € E et les inégalités || y’ — 
— Yo | LÔ, |[y” — yo | LÔ impliquent l'inégalité 


IV, y) — x, y) — Ag — y < e [y — y” ||; 
3) AY =.7 


alors il existe un nombre K >> 0, un voisinage 4 du point (xs, Zo) 
dans À X Z'et une application @: A—- Y tels que 


a) V(x, (x, z)) =; 
b) px, 2) — yo IS AY (x, yo) — 21: 


2.3.2. Modification du principe des applications contractantes. 

Lemme. Soient T un espace topologique, Y un espace de Banach, 
V un voisinage du point (t,, yo) dans T X Y, ® une application de V 
dans Y. S'il existe un voisinage U du point t, dans T, un nombre 
B > 0 et un nombre 6,0 < 6 1, tels que tEUet || y — yo | < B 
impliquent 


a) (4, D, y) EV; 
b) ID @&, D (4, y)) — D (, y) 0 HD (6, y) — y; 
c) D (é, yo) — yo 1 < B (1 — 8), 


alors la suite {y, (t)|n > 0}, définie par récurrence de la manière suivante 
Yo (&) = Yo» Un () = D (#, Yn-1 (6), 


pour tout t E U, est contenue dans la boule 


B (Yo: B) = {y 11 y — yo | À} 


et converge uniformément pour t E U vers l'application t > ® (t) 
et l’on a 


® (£, — 
pv El 


Démonstration. Nous démontrerons le lemme par 
récurrence. Soit é un élément de U. Désignons par [, l’assertion : 


« L'élément y, (£) est défini pour 0 k4< net appartient à B (Yos B) ». 
Puisque y, (t) — yo € B (yo, B), l’assertion l', est vérifiée. Supposons 
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que F, est démontrée. Alors, pour 1< k< n, nous avons 


pau (0) ur O IE © (#, Yr (t))— D (6, yr- NE 
=||[D(é, Dé, yat) —D(E, ya GI 


def 
LO[D(E, Yna (Ë)) — Yna (E) [= 0 Yr (E) — Yn-a (6) If. 
En continuant ce raisonnement, on obtient 


Yr+ ©) — ya CE) KO [yx (6) — yr (6) NS 
82 [| yns () — Ye ENS. + LÀ [ya À) — y | = 
= 6 1 D (6, Yo) — Yo Île 

Supposons maintenant que k> 1, k + In +1; alors, d’a- 
près l'inégalité du triangle, 
Ya CE) — yr GE) = 

= [| Yn4 G)— Ynt- à (€) + Yan () — 20 HVne (©) — Ya CI 

ONE Me ID (6, Yo) — Yo < 


<(36)ID(E, v)—vl=r TD vo)—-voll <0B. (0 
s—=R 
En particulier, si l’on pose k + ! = n + 1, k = 1, dans (1) et l’on 
se sert de la condition c), on obtient 


Yn+s ) — Yo 1 = 'Yn+a À) — Ya À) + ya (À) — Yo NE 
|| Yn+1 €) — Ya ©) + I ya À) — yo 1 << 88 + B (1 — 0) = À. 


Par conséquent, l',+, est vérifiée, d’où l’on obtient par récurrence 
que cette assertion est valable pour tous les n. Maïs alors (1) implique 


Nunee (0 — un OURS ND vo) —volh VE #1 (2) 


Il découle de (2) que la suite {y OIL? 0} est fondamentale et, 
Y étant complet, converge à un certain élément que nous désigne- 
rons par  (£). Si l’on passe à la D pour /—+ © dans (2), on obtient 


IE p (é) — y (t) IS gi D(E Vo) —Yoll < 8FB. (3) 


Il découle de (3) que l’application t + y4 (6), t E U, converge uni- 
formément vers l'application > @ (ft). Enfin, si l’on pose 4 — 1 
dans (3), on obtient 


PC) — Yo = 11 p CE) — ya CE) + ya () — vol 
<< ID CE, v)—vll+ID CE vo vo E vo 
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2.3.3. Démonstration du théorème. La démonstration du théorème 
énoncé dans 2.3.1 se décompose en plusieurs parties. 

A) Par hypothèse, À est un épimorphisme de Y dans Z. Par 
conséquent, d’après le lemme sur l’application inverse à droite 
(voir 2.1.5), il existe une application M: Z— Y telle que 

(A o M) (2) = 2, (1) 

M () I<CIz I (2) 

pour un certain C > 0. Posons 7 — X X Z et vérifions si les hypo- 
thèses du lemme de 2.3.2 sont remplies pour l’application 
PE y =D 2 y =y+MG—-T(, y). 

B) Choisissons 8, 0 < 8 1 et e — 60/C, où C est la constante 
de (2), et trouvons un voisinage £, du point x, et un nombre f, > 0 


tels que les inégalités [| y" — yo [| << Bo, 1 Y" — yo 1 Bo impli- 
quent (conformément à la condition 2) du théorème) l'inégalité 


(pour ze *#,) 

TG y)—T(@&, y) —AG%g —-y)l<ely —y" il (@) 

Désignons V = E&, X Z X B (yo, Bo). 

C) Soit B = B,/(C [| A || + 2). En nous servant de la continui- 
té de la fonction (x, z) + (x, yo) — z au point (xs, z9) (voir la 
condition 1) du théorème), choiïisissons un voisinage E, CE, du 
point x, et un nombre y >> 0 tels que l'inclusion 


(x, 2 EU = 8: X B (av Y) 
implique l'inégalité 
I Ÿ (x, yo) — 2 [1 << B (1 — 8)/C. (4) 
D) Si (x, 2) EXLet y E B (yo, BP), on a 


def (2) 
ID (x, 4, y —y = y —vo+MG—Ÿ (x, y)) 1 
y — yo +CHz-Ÿ(, y) IK y — y | + 
+ C{lz — Ÿ (x, Yo) — x, y + (x, Yo) + À (Y — Yo) — 
— À (y — Yo) ID <I1y — vol + € {z — Ÿ (x, Yo) || + . 


( 
+ IE, y) — Fix, yo) — À (y — yo) I + I A — vo) P}< 
< |1y— Yo 1+C {2 Ÿ (x, yo) + 1 y— vol + HAN Yy—vo I} < 
<A+O0+CIAN y — vol + CZ — Ÿ (&, Yo) | (5) 
(car eC = 0). 
I1 découle de (5), en vertu de (4), que, premièrement, 
ID (x, Z y) —Yol < 


<(1+0+CIAMB+CÈET = (G+CIAMPR=Se 6) 
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Ainsi, on a la condition a) du lemme de 2.3.2: (x, z, ® (x, z, y)) € V. 
Deuxièmement, pour y = y,, on obtient 


D, B(1—0) 
D (x, 2, yo) —ÿo SC IIz- Te, y)I<C = (1-0). 
(5”) 


Ainsi, on a la condition c) du lemme de 2.3.2. 
E) Si l’on a à nouveau (x, z) EL, y E B (yo, P), alors 


D (x, Z, D (x, Z; y)) — D (x, 3; y) = 
= Dix, 2,7) +M(z— WVi(x, Dix, z, y) — D(x, 2, y) — 
=MG—T(x, P(x z, y). (6) 


En se servant de (1), on obtient 
AD (x, 2, y) = Ay + AMG—T (x, y) = Ay+z—T (x, y), 
d’où 
z2= V(x, y) + A(® (x, z, y) — y). (7) 


En substituant (7) dans (6) et en se servant de la relation ® (x, z, y) € 
€ B (Yo Bo), Valable en vertu de (5°), on a 


(6) 

HD (x, 2, D (x, 2, y)) — D (x, 2, y) || — 
2) (D) 
= NMG— (x, D (x, 2 y) CIz— (a, P (x, z, y)ll= 


= CNY, De 2 D) — Ve, D — AO (e, 4 ÿ — nlE 
LCelr=-06znl=6lr-d6 2 nl (8) 


Aïnsi la condition b) du lemme de 2.3.2 est remplie. 

F) Comparons à nouveau le lemme de 2.3.2 et nos constructions. 
À l’espace topologique T7 du lemme correspond dans notre cas le 
produit X X Z, au point f#,, le point (x,, Z0), au voisinage U du 
point {,, le voisinage %, du point (xo, Z,) ; au voisinage V du lemme 
correspond le voisinage V construit dans B), à l'application (#, y) 
> ® (£, y) correspond dans notre cas l’application (x, z, y) > ® (x, 2, 
y), au nombre f du lemme correspond le nombre $ construit dans CO). 

Alors la relation (5') signifie que l’on a l’hypothèse a) du lem- 
me, la relation (5”), que l’on a l’hypothèse c) et enfin la relation (8) 
signifie que l’on a l’hypothèse b). Aïnsi le lemme peut être appliqué. 

G) D'après le lemme, la suite {y, (x, z) [|n> 0}, (x, 2) E Ÿ, 
définie par les relations récurrentes 


Yo (Es 2) = Yos  Yn+1 (2, 2) = D (x, z, y, (x, 2)), 
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est contenue pour tous les n > 0 dans la boule B (y,, B) et converge 
uniformément vers la fonction œ (x, z), de plus 


: def 
px, z)— yo ID (&, 3, yo) — Yo |l/(1 —0) — 


ZM GT vo) A0 2 Ÿœ vo) 





de sorte qu’on a l’assertion b) du théorème pour K = C/(1 — 8). 
H) IF, p (x, 2)) —211< 


CV pe 2) — Ye un @, 2 + IT Ge te, 2) 
IN 9 (6 9) — Van (6 9) — A (@ (9 — du ( D 
a à 
+ IA (op (, 2) — un ( 21 + NAM G — Ÿ (, mn @, 2 € 
Celle te, 2 — m8 @ 2) + Il AN lle @ à — 0 @ D + 
Nm l Â I Ï Un +1 (x, z) — Un (Z, z) [| —- 0 


pour n—+ co. Par conséquent, Ÿ (x, œ (x, z)) — 2. 


2.3.4. Théorèmes classiques des fonctions implicites et des applica- 
tions inverses. Du théorème général démontré ci-dessus, on peut 
déduire deux théorèmes classiques qui sont souvent employés dans 
diverses branches des mathématiques où l’on applique l'analyse, par 
exemple, en géométrie différentielle. En comparaison de 2.3.1, nous 
renforcerons en deux directions les conditions imposées à la fonc- 
tion Ÿ. Premièrement, nous la supposerons maintenant continüment 
différentiable et deuxièmement — ce qui est le plus important — 
l’opérateur À qui apparaît dans l’énoncé du théorème de 2.3.1 sera 
supposé inversible. Tout ceci nous garantit la différentiabilité et 
l’unicité de la fonction implicite. 

A) Théorème classique des fonctions im- 
plicites. Soient X, Y, Z des espaces de Banach, W un voisinage 
dans X X Y, Y:W— Z une application de classe C'(W). Si: 

LT (Gor Yo) = 0; | 

2) il existe un opérateur inverse [W,, (xs, yo) TE £ (Z, Y), | 

alors il existe des nombres & > 0, Ô > 0 et une application ®: B (x,, 


Ô)—+ Ÿ de classe C1 (B (to, Ô)) tels que 
a) P (Zo) = Yo: (2) 
b) Hr—x<ô—={|p(r) — y 1 <Leet Y (x, p(x)) =0; 


c) dans le « rectangle » B (to, Ô) X B (Yo, €) l'égalité Y (x, y) = 0 
n'est possible que si y = op (x); 


d) p@)= —[F, (@, p GITES (x, p (x). (5) 
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Démonstration. Il découle de la différentiabilité con- 
tinue de Ÿ dans W que l’on a les hypothèses 1) et 2) du théorème 
d'existence des fonctions implicites de 2.3.1 (pour vérifier 2), il 
faut poser À = Ÿ, (xo, yo) et se servir du théorème de la moyenne). 
La condition (3) est vérifiée puisque Ÿr' (xs, yo) existe. Par consé- 
quent, d’après ce théorème, on peut trouver un nombre Æ >> 0, un 
voisinage Ü 3 x, et une application œ: U— Y tels que 


F@&, p(@)) = 0, (à) 


Ip (x) — yo IS AT (&, yo) Il. (9) 

En posant x = x, dans (5) et en se servant de (1), on obtient (2), 
tandis que (4) donne la deuxième moitié de l’assertion b). 

B) L'application W appartient à C1 (W); elle est donc stricte- 

ment différentiable au point (xs, yo) (corollaire 2 de 2.2.3). Par con- 
séquent, pour tout x => 0, il existe un & (x) > 0 tel que 


ti —r<e(x), My: —yol<e(x), i=1,2,= 
> [| (tu Ya) — Vos Ve) — Pr (Los Yo) (1 — 2) — 
—Y, (Zos Yo) (Yi — Ye) IS X max {ft — Le |, | Yi — Yo Il}. (6) 


Posons d’abord x, = 1/2 [|| Ÿ}' (to, Yo) Il et trouvons le & — 
— €£ (x,) correspondant. Puisque Ÿ (x, y) est continue et Ÿ (x,, yo) — 
= 0, il existe un Ô, 0  Ô Le, tel que 


B (to, 8) = {|lr—-m<8cUe 


la << Ie@-ni<e (D 

par conséquent, on a la première moitié de l’assertion b). . 
_Supposons maintenant que Ÿ (x, y) —=0 au point (x, y) € 
EB (to, Ô) X B (Yo, €). En appliquant (6) avec la valeur de x, 
Re ci-dessus (ty = Ze = Æ, Yi = Y, Yo = (x)), on obtient 


| y — (x) = 11 (Zos Yo) Le (Zos Yo) (== P (x)) << 
IE Go VITE, DT, PO)—E, x v)È—-0I< 


RACE EX PEL CEE NPE e G)lL 


ce qui est possible seulement pour y = = (x), ie. l”  . c) est 
vérifiée. 

C) Pour les mêmes %,, &, Ô, posons x, = x, 22 —=.%o, Yy — Ve = Yo 
dans (6), alors 


(6) : 
x — zoo <ô = (x, yo) —Ÿ (to, Yo) —Yx (Zo: Yo) (t —Xo)ll 


lasser ele noel 
lon lee rl) AL (© 


11—0237 
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Choisissons maintenant %, > 0 de manière arbitraire et appli- 
quons (6) à 
TL Lo = Los Yi = PT), Ye = Yo: 


Pour 
_ € (X1) 
G= min {e (4) Ur Qu 192) 
on a 


xt < Gi I Tr (ro Yo) Fr (to Vo) (&— To) + (xt) —%ll= 
= || Pr (to, Yo) {Ve (Los Yo) (ET — Xo) + Puy (Gos Yo) (p (2) — )} I 
| Pi (to Yo F@&, px) — (ro, Vo) — 


(6) 
— Pr (dos Vo) (t—Xo) — Ty (to: Yo) (P (x) — ll 
(8) 
| Fr Go Vo) 1 max {r—-t ll, 1PG)—yI<CkIx-x I où 


CV (Go Yo) II max 1, KI Pr (to, Yo) Il + %o)}. 
Puisque x, est choisi arbitrairement, l’inégalité démontrée montre 
que pour z—+ Zo On à 

Vu (or Yo) Vx (Los Yo) (& — To) + P (x) — Yo = 0 (x — To) 
ou bien 
p (x) = Yo + [— VS (to, Yo) Vx (Go Yo)l ( — Zo) + 0 (t — &o), 
par conséquent, la dérivée de Fréchet œ" (x,) existe, l'égalité (3) 
ayant lieu pour x = x,. 

Pour démontrer la différentiabilité de @ pour les autres valeurs 
de x, rappelons que l’ensemble des opérateurs À pour lesquels un 
opérateur inverse existe est ouvert dans Z (X, Ÿ) (proposition 3 
de 2.2.1). Par conséquent, en prenant, s’il le faut, Ô plus petit, on 
peut supposer que Wr' (x, œ(x)) existe lorsque || x — x, || 6. 

Nous pouvons maintenant répéter toute la démonstration en 
remplaçant le point (x,, yo) par le point (x,  (x)}, où || æ — xo [| << 6. 
En vertu de l’unicité déjà démontrée, nous obtiendrons la même 
fonction œ (x) (à condition que || x — x || soit suffisamment petit) 
et, pour cette fonction, la formule (3) sera valable si x = x. Puis- 
que æ était arbitraire, l’assertion d) est vérifiée pour tous les x € 
€ B (xo, 6). ; ; . 

Enfin, la dérivée ®’ (x) est continue puisque, en vertu de (3), 
elle se représente sous forme de composée d'applications continues 


Tt> (x, D (x)), (x, y) > Ÿ, (x, y), (x, y) Y, (x, y), A A7 


(La dernière est continue, puisqu'elle est différentiable selon Fré- 
chet d’après la proposition 3 de 2.2.1.) M 
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Remarque. Si, en plus des hypothèses du théorème, on a 


WECT(W), r>2, alors ® € CT (B (xo, Ô)). 

En effet, il découle de la formule (3) et du théorème de super- 

position que la dérivée seconde 
p" (a) = — {V, (x, p ()) Te Vi (x, p (@))} 

existe et est continue. Ensuite on raisonne par récurrence. 

Théorème sur l'application inverse. 
Soient Y et Z des espaces de Banach, W un voisinage du point y, dans Ÿ, 
Y:W— Z une application de classe C1 (W) et z5 = Y (yo). 

Si l'opérateur inverse W' (y,)"! € L (Z, Y) existe, alors: 

a) on peut trouver un & >> 0, tel que B (y, =) Wet V = {z|2z— 
= Vy), Iy —vol<e} = Ÿ(B (yo E)) est un voisinage de z 
dans Z'; 

b) on peut trouver une application D: V—+ Y de classe C1 (V} 


inverse à Y | B (yo, €), t.e. telle que 


y= D z=V(y), (y, 2 € B (yo €) X V; (9) 
c) D) = [FE (GNT. (10) 
Démonstration. A) L'application W € C! (W) est stric- 
tement différentiable en chaque point de W, en particulier au point 
Yo. Par conséquent, pour chaque x >> 0, on peut trouver un € (x) > 0 
tel que 
y: —yol<e(x), i=1,2, = 
+ | Ga) — Fe) — Ÿ (Vo) 1 — Ye) IS 4 ya — ve ll (1) 


Choisissons & > 0 de sorte que pour tous les y € B (yo, €) il existe 
un opérateur inverse W” (y)? (voir proposition 3 de 2.2.1) et que l’on 
ait e<e(xo), où %o = 1/2 || LS” (yo)? |] “À 

La dernière relation garantit l’injectivité de l’application Y 


sur B (Yo €): 


Vas Yo CB (Yo €), V(y) = (y) 
= || —ÿyll= | Po) 1 Po) Yi — pl 


(11) 
< || (go) IE Ga) — Ÿ (ge) — T7 (go) (ÿ4 — y) 
, = 1 1 
<<] F7 (Vo) SFr ri 72 = y Ye y1= Ye 


Nous montrerons ensuite que la boule À (Yo, €) est celle dont il 
s’agit dans la condition a) du théorème, maïs pour le moment, posons 


11% 
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V=Y (B (Yo, €)). L'application Y | B (Yo; €) étant injective, est 
inversible, de sorte qu’une application D: V— B (y,, e) possédant la 
propriété (9) existe. 

B) Pour tout point y € B (yo, e) appliquons le théorème de 2.3.1 
à l'application Ÿ (y) (qui ne dépend pas de x, de sorte que l’espace X 


peut être arbitraire) dans un voisinage du point y. La condition 1) de 
ce théorème est triviale ici; la condition 2) se transforme en celle 


de différentiabilité stricte au point y et, comme nous l'avons remar- 
qué, elle est vérifiée, et l’on a A — Y”’ (y): la condition 3) est remplie 


puisque y € B (Yo, €) et, conformément au choix de &, W’ (y)-! existe. 
D’ après le théorème de 2.3.1, il existe un voisinage U du point 


2 = Y (y) et une application : U— Y tels que 
T (p (G)) = 2, (12) 
Ip) IE Iz—21 (13) 


pour un certain À >0. Choisissons 8 > 0 si petit que B (2, Ô) 
aU et 5<(e—||y—y||}/Æ. Alors 


x (13) à RE re 
Mz— 21 <= og <Ek (it) à 
pv <ez=V(p()) EF (B (0 €) = 
=V +8 (7, 0) = y, 


Aïnsi chaque point z2EV possède un voisinage BP (z, 8) V, de 
sorte que V est ouvert. En outre, pour z € B (z,, 0),ona 


(eo (2) 2 = Y (D (D) + p (9 = D ( (14) 


d’après l’injectivité de WY. 
C) Démontrons maintenant la différentiabilité de ® et la for- 
mule (10). En vertu de la différentiabilité stricte de Ÿ au point 


y = D (2) on a une assertion analogue à (11): pour tout x > 0 il 
existe un € (x) > 0 tel que 


Hyi—yll<e(x), i=1,2, > 
+ || Ÿ (gs) — Ÿ (ge) — T° (y) Ga — ve) ASK y — y (5) 
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En posant ici y; —© (2), Y=y— D (2), on obtient 


DCE 


: (15) 
az << IDE -TI<eGe 


> || P (D (2) — Ÿ (D (2)) — Ÿ’ (y) (D (2) —D QUE 
AU ETES ETES 
= ||2—2—% (9) (D (2) —-DGISXKz—-21=+ 
= || D (2) —D (2) —Ÿ (y) 1 (2 — 2) = 
= | G) (2-2 (y) (D (2 —D (DIS 
| (U) 4 ILxE [2 —2 If, 
et donc 
D(2)—®D(z)—Y' (y) 1 (2— 2) = 0(2—2) 


pour z—> z, car x est arbitraire. Par conséquent, la dérivée de Fré- 
chet D’ (z) — Ÿ” (y)! existe et (10) est démontrée. La dérivée ®(2) 
est continue sur V puisque, en vertu de (10), elle se représente comme 
la composée des applications continues z2r+> ©® (2), y Ÿ' (y) et 
A +> A”t (la dernière est continue d’après la proposition 3 de 2.2.1). 


2.3.5. Espace tangent et théorème de Lusternik. Dans ce sous- 
paragraphe, X est un espace normé, M un sous-ensemble de X. 

Définition. L'élément h € X est appelé vecteur tangent 
à M au point x9 € M, s’il existe un nombre & >> 0 et une application 
r:[—e, e]— X tels que 

a) XL +ah+r(a) EM, 

b) r (4) = o (œ) pour a — 0. 

L'élément À € X est appelé vecteur tangent unilatère à M au point 
20 € M, s’il existe un € >> 0 et une application r: (0, e)— X tels que 
a) est vérifiée tandis que b) a lieu pour a j 0. 

L'ensemble de tous les vecteurs tangents à M au point x, est 
désigné par 7, M, l’ensemble des vecteurs tangents unilatères par 
TM. Il est évident que T,MCTIM et que TM = Ti M N 
N (= TM). Si l’ensemble 7, A7 est un sous-espace de X, alors on 
l’ appelle espace tangent à M au point Zo. 

Remarque. En géométrie, on appelle généralement droite 
tangente, plan tangent, etc., non pas T, M, mais la variété affine 
Zo + Tr, M (voir figure 33). 

Exemples (les détails des démonstrations sont laissés au 
lecteur). 
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1) X = R, M = {(x, y)|1xz2>0} (fig. 34); Ti, oM = M, 
Too. oM = {(0, DIbÈR}, Ta oM = Th, oM = R2 





Fig. 33 Fig. 34 


2) X—=R2, M ={(x, y)|x>0, y>0} = R? (fig. 39); 
Ta.oM={(@, 0)|a ER}, To.oM =4{0}, To, M ={(0, b)bER}, 
TA, o)M = {(a, b)|a CR, b>0}, T(o, o)M = NW, To, 1)M = {(a, b )laz> 

>0, bER}. 


3 X =Y X R, où Y est un espace normé et M — {(y, 2) |z = 
= || y ||}, est un cône (fig. 36) 


To, o M — {0}, To, M — M. 


Z 


à 


Fig. 35 Fig. 36 


Exercices 
1. Supposons que Ÿ est un espace de Hilbert (par exemple Y — R?); 
trouver T(,.yyyy M et TÉ,, jy y dans l’exemple 3) pour y - 0 (fig. 36). 


2. Trouver T,M et T£M lorsque 
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a) M={2"]|n—=1,2,...}U{0O}CR, a=0; 
b) m={+|n=1,2 .….}U@ CR, a=0: 


co) M=U(x, y)lr=y}cR?, a—(0, 0) et a—(1, 1); 

d) M={(x, y)Ir2<<yS}CR?, a=(0, 0) et a—(1, 1); 

e) M={(x, y)l2x?>y}CR?, a=(0, 0) et a=(1, 1); 

fÎ) M = {(x, y, 2) | z = À si x et y sont rationnels, z = 0 dans les autres 
cas}, a — (0, 0, 1 


Dans de nombreux cas, en particulier dans certains qui présen- 
tent un intérêt particulier pour la théorie des problèmes d’extrémum, 
l’ensemble des vecteurs tangents peut être trouvé à l’aide du théo- 
rème général suivant. 

Théorème de Lusternik. Soient X, Z des espaces de 
Panach, U un voisinage du point x, dans X, F:U— Z, F (xs) = 0. 

Si F est strictement différentiable au point x, et F' (x) est un 
épimorphisme, alors l’ensemble M = {x | F (x) — 0} possède au point 
ZT, Un espace langent 

TM = Ti,M = Ker F° (x). 


Démonstration. A) Soit kET;M. Alors, si r (+) est 
l’application qui figure dans la définition du vecteur tangent 
unilatère, on a, en vertu de la différentiabilité stricte, 
O=F(xs + ah +r(a)) = F (xs) + af" (xs) h + 0 (ax) — 

— af" (xs) k + 0 (a). 
Donc F' (xs) h — 0, et Ti M CKer F” (x). 

B) Appliquons le théorème de 2.3.1 à l’application Y (x, y) = 
= F (x + y). D'après la différentiabilité stricte de F, l’application 
tt Y (x, 0) est continue au point x, et 


UE Ge, y) — Ta, y) — FE (xo) Y — y) Ke y — "Il, 
lorsque || x — x, || 6, || y’ || 6, | y ” I 6. La condition 3) du 
théorème de 2.3.1 est également remplie, car F” (x,) applique X sur Z. 
Conformément à ce théorème, il existe une application œ: U— X du 
voisinage U € X du point x, telle que 

Vr, px) =0< F (x + p(x)) = 0, 
Ip G) IS AIT (x 0) = XF (a) 1: 
Il ne reste qu’à poser r (a) — œ@ (x, + ah). Alors 
F(x + ah+r(a)) = F (xs + ah + œ (xo + ah)) = 0, 
Ir (a) = 1 (ro + ah) I KI (xo + &h) || — 
= KI FE (co + ah) — F (to) 1 = KI F(&o) ch + 0 (ak 11) || — 
= À af” (to) k + 0 (a) If, 
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et si À € Ker F” (x,), alors || r (œ) || = o (x). Par conséquent, 
Ker F'(x) CT;M CT: M. M 

Au niveau de l'intuition géométrique, le théorème de Lusternik 
est particulièrement transparent. En laissant de côté la rigueur, on 
peut définir l’espace Z tangent à l’ensemble 7 au point x, en disant 
« qu'aux infiniment petits d’ordre supérieur près », M peut être 
approximé par la variété affine x, + L. Mais dans un « voisinage 
infiniment petit » du point x, la fonction F peut être approximée 
par sa partie linéaire 

F (x) & FE (to) + EF (to) (x — to) = EF (to) (X — to) (1) 

(le point x, appartient à M et donc F (x,) = 0), tandis que l’ensemble 
M = {x |F (x) = 0} peut être approximé par l’ensemble 


M = {x | EF" (xo) (x — 0) = 0} = Ker F” (xs) + to. 


Aïnsi, « aux infiniment petits d'ordre supérieur près », M coïncide 
avec la variété affine M = x, + Ker F'(x,), par conséquent, 
Ker F” (x,) est l’espace tangent. 
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2.4.1. Opérateur de Nemytski et opérateur de relation différentia- 
ble. Soit U un ensemble ouvert de R X R” ; supposons que la fonction 
1 (t, x):U— R7et sa dérivée partielle f, (£, x) sont continues dans U. 
A l’aide de l'égalité 

S'RC)hO=(G xt), b<i<t (1) 
définissons l'application #:4— C ([t,, 4], R”) sur l’ensemble 

U = {x (+) € C (Lo, t1}, KR”) | (£, T (£)) Ê U, to < << ti}. (2) 
Cette application sera appelée opérateur de Nemytski. 

Exercice 1. Montrer que l’ensemble (2) est ouvert dans C ([to, t1], R°). 


Proposition 1. L'opérateur de Nemytski donné par la rela- 
tion (1) est continûment différentiable sur l'ensemble (2) et l’on a 





SN CHR (IE) = fx (6) RE, (3) 
ou 

> ; . = 4{,...,m, 

fo (4 (&, æ(t)), ne os (4) 


est la matrice de Jacobi. 
Démonstration. Calculons d’abord la première varia- 
tion selon Lagrange de l’application .W°. Par définition, 


œ 


SN (EC); AC) = lim A EUHMONHECD, 
a—0 
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À gauche et à droite nous avons ici des éléments de l’espace C ([6,, t,l 
R®), i.e. des fonctions de £ € [t,, t.1. Pour t fixe, on a 


Lim ZEU+e (DOS ECDE 
œ—+0 é 
im {érO Ha) 2) 

a 0 


=f,(t, 2(O)h(D=f.(Dh(t#). (5) 


Pour nous convaincre que la convergence a lieu ici également dans 
le sens de l’espace C (fé,, t.1, R"'), i.e. qu’elle est uniforme, remar- 
quons que pour un certain a >> 0 le compact 


H = {ta 1lr—-z(tlSa to<i<t} 
est contenu dans U et f, est uniformément continu sur ce compact. 
Cela signifie que 
Ve 0, 14360, | —&"|<6ô, |x — zx" | <Ô—= 
> [fx (7, 2) — fx (7, a) << e. 
Si [a |<6/|h(-)||c, alors le théorème de la moyenne (2.2.3), 
implique 


| SE CHR DS EC (02 0)|- 


_ max LE FO Ha (TE, x (D) (6 3 (E) oh (D) | < 
EL to, t1] É 








< max max [/x(é Z(é)+0ah(9)—f(t, (IR (SE Alle. 
te[to, t1] OELO, 1]: 
(6) 


Par conséquent, la convergence de (5) est effectivement uniforme, et. 
nous avons démontré l’existence de la première variation selon 
Lagrange 


SN (x), RC) CO) = fx (6) Rk (D. 
Puisque la première variation est donnée par un opérateur linéaire. 
S'e&():C (lo ls R°)+C (To él, R”), 
et c’est précisément JG (x (-)) qui est l’opérateur de multipli- 
cation par la fonction matricielle f,(t) et il est borné: 


IFRGODNIS max [fe @ 2G)IL (7) 
tElto, t1] 
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on voit que .#° (x (-)) est différentiable selon Gâteaux. Pour démon- 
trer la continuité de la dérivée de Gâteaux, trouvons une estimation 
de la norme de la différence 


IL P'e (&(C))— de (& CIE 
— sup We) (Se (x (0) LR CON 


L'OP< 


max || fe (£, 2 (0) À (0 — fe (E, x (8)) À (DIS 


AC) CE 1Elto, ta 


Z max [fé x(t))—fL(t, z(é))Il. 
tE(to, t1] 

À nouveau, à l’aide du compact & et de la continuité uniforme de 
fx, vérifions la continuité de .#°G (x (-)) par rapport à x (+) E 4. En 
appliquant maintenant le corollaire 2 de 2.2.3, nous voyons que 
S° (x (+)) possède en chaque point de l’ensemble % une dérivée de 
Fréchet et qu'il est strictement différentiable. En vertu de l'égalité 
Se = SN", la dérivée de Fréchet est continue dans %,/. M 


Exercice 2. Démontrer que l’on a l'égalité dans (7). 


Supposons maintenant que ÜU est un ensemble ouvert dans R X 
X R° X KR’, la fonction f (t, x, u): U— R ainsi que ses dérivées 
partielles f,, f, étant continues dans U. L’application .#° : A —- 
—+ C (Lo, t1l, R°) définie sur l’ensemble 
U= {RC} u(C)I(, x), u (EU, L<i<th}e 
a CT (to, dl, R7) X C' (lé, til, R7)  (@) 


par l'égalité 
NC), u() O = f(, x (E), u ()), (9) 


.sera également appelée opérateur de Nemytski. 
Proposition 2. L'opérateur de Nemytski donné par les 
relations (8) est continûment dif férentiable sur l’ensemble (9) et l’on a 


S'EC) CDR) v(NO=ÉOR(E+ PA Év(E, (10) 


.oÙ 


f. (<= (2G<0 0), li <ie m , 1—=1..:n 


4 


} , 
fe (EEE EU), 24, mm, k=t,..., r). (12) 


ou: 
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Démonstration. Comme dans le cas précédent, l’appli- 
cation .#° possède des dérivées partielles 


J'at) 4C)lA()I (= fx (06 À (6, 
Sat), 2(C) OO Ov), 


et les applications 
Pr: U— £ (C' (Los ta], R”, C'([£0 ta], R”)), 
Nu Ur LE (C'(o, dl, R7), C'(Léo tal, R7) 


sont continues dans %/. Il ne reste qu’à appliquer le théorème sur la 
différentielle totale (voir 2.2.4). 

Supposons maintenant que U et % sont les mêmes que dans l’exem- 
ple précédent, la fonction  (é, x, u): U— R” et ses dérivées partiel- 
les p+, ®, étant continues dans U. L'application D: %— C ([to, t1l, 
R”) définie par l'égalité 


Déx(-)u(-)( =z(—p(é, (6), u (t)), (13) 


sera appelée opérateur de relation différentielle. 

Proposition 3. L'opérateur de relation différentielle dé- 
fini par l'égalité (13) est continûment différentiable sur l’ensemble (8) 
et l’on a 


D'{&(-), u(-))Ik(-), uv) = A (D — px (6) h (0 — pu ()v (6), (14) 


où 


de n 0P; se .u e 0 
Pa () + (RERO, RE 
re 0; ,Z ,ü . 
Qu (= (HERO EO), tion Éetongil 
(16) 


Démonstration. L'application ® est la différence en- 


tre un opérateur linéaire continu (x (+), u (-)) x (-) et l’opérateur 
de Nemytski .#'(x (-),u (-)) (£) = œ(t, x (t), u (t)). Par conséquent, 
l’assertion qu’il faut démontrer découle des propriétés générales des 
dérivées (voir 2.2.1) et de la proposition 2. M 


2.4.2. Fonctionnelle intégrale. Soit U un ensemble ouvert dans 


R X R°® X R'et supposons que la fonction f (#, x, 2): U—+ RTet 
ses dérivées partielles f,, f. sont continues dans U. Donnons-nous 


l'application Y : #° — R7 ‘sur l’ensemble 
D = {r(-)EC UE til, A) LG, z(, z(H)EU, tit} (1) 
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en posant 
Î1 


JC)= (IE 20), 2) dt. (2) 


to 


Proposition 1. L'application intégrale (2) est continûment 
différentiable sur l’ensemble (1) et l’on a 


J'ECR ONE | GO 20 +É0 2 YA, (3) 


lo 


le (5 26, O6). A 
FO (LG, 20, 20) 1-4. m, j=4 nr). O 


Démonstration. Représentons l'application (2) comme 
la composée 


JL D, 
où 
D: CUIt, dl, R7)— CUt, &1, R7) X C (Lt, dl, R7) 


est un opérateur linéaire continu, défini par l'égalité 


D (6 ()) = (x (+), x (C)y: 
SU Clé, à], R° 
est l’opérateur de Nemytski, défini par l'égalité (9) de 2.4.1 (pour 
r = n), et 
L: C(lto, ul, R7)— R? 
est l’opérateur d'intégration 
l1 
L(e(-))= | 2 (0 dt 
to 
lui aussi linéaire et continu. Tous ces opérateurs sont différentiables 
(voir 2.2.1 et la proposition 2 de 2.4.1), la dérivée de l'opérateur 
linéaire coïncidant avec celui-ci, tandis que la dérivée de l’opérateur 


de Nemytski est donnée par la formule (10) de 2.4.1. D'après le 
théorème de superposition, on a | 


J'(&(-)=To f"(Dr(-)oD, (6) 
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i.e. 
J'ECACH=LLS" (DZ (-)) IDR ()1}= 
IS" &(), zh (), AO 
= I {fx (0) h (D + f. (D (8) = 


= À (60 (+ É. (0 2} dt. 
to 


Ceci démontre la formule (3). La continuité de J” (x (-)) découle de 
la continuité de la dérivée de l’opérateur de Nemytski et de l’éga- 


lité (6). 
Exercice. Trouver les normes des opérateurs D et J. 


Dans les problèmes du calcul des variations classique et de com- 
mande optimale, on envisage également des fonctionnelles intégrales 
de la forme (2) à limites d'intégration variables t, et £,. Pour les 
inclure dans le schéma général, nous procéderons de la manière 


suivante. 


Supposons que les hypothèses concernant f (£, x, x) sont les mêmes 
que précédemment et À = R est un intervalle fermé, 


A = {( (-), Lo; Li) | Z (:) € C1 (A, R7)< 
txt), zÜ)EU, +tEA; t,t\Eint A} (7) 
Définissons l’application Y : 2— R7 en posant 


t1 
JC) to = |, x (0, & (0) dt. (8) 
to 
Proposition 2. L'application intégrale (8) est continâment 
différentiable sur l’ensemtle (7) et l’on a 


SC) do IRC) To Gil = 
l1 
= | AOrO+ÉOAO) A+ IE UE, 
10 
où f. (t) et Î. (t) sont déterminés par les formules (4) et (9), 


tandis que 


fO=f(, z(t), x(b). (10) 
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Démonstration. Servons-nous du théorème sur la dif- 
férentielle totale de 2.2.4. Les dérivées partielles existent en vertu de 
la proposition 1 et du théorème classique sur la dérivée de l'intégrale 
par rapport aux limites d'intégration inférieure et supérieure : 


f 
Ta EC) do 0 CNE | O 20 +, (0 À O} di, 
i 


Jr (+); Los À) Erol = — f (Ëo) Tos 
Jt: (x (-), t) [Ti] = j (ë) T4. 


Passons à la vérification de la continuité des dérivées partielles 


A) JC), to t)— di (Ch to U)l= 
nn Il 7 (os Z (bo); z (to)) To— f (os z (to); LH) ol 
Sin 2 26) fn 260 26. (1) 


En outre, 


Le (to) — 2 ()1 [T & (to) — 2 (bo)| + 12 (bo) — 2 (b)| 
<||z(-)—2 (+ 1e (Go) —2()l, (12) 


LE (bo) — 2 (Go) IE (bo) — 2 (to) + 12 (bo) — 7 (| 
<|iz(-)—2(-)l a+ 12 (Co) —2(bo)l. (43) 


Par conséquent, lorsque tot et z()—z(:) dans C!(A, R"), 


on à x (to) + & (to); z(t) —zx(t,) et donc le deuxième membre de 
l'inégalité (11) tend vers zéro. Donc Y3,(æ(-), to, t1) dépend 
continâment de (æ(-), to, ta) (cette dérivée ne dépend point de 
t). La continuité de Ÿs,(æ(-+), to, t1) se vérifie d’une manière 
analogue. 

B) Choisissons un nombre a = 0 de sorte que le compact 


HA = {(t zu) |Ir—-zr(l<a, lu—z(t)|<atEA)} 
soit contenu dans U. Sur ce compact, les dérivées f,(t, x, x) et 
f.(t, x, x) sont uniformément continues et bornées. Maintenant, 
* 


$ 2.4] DIFFÉRENTIABILITÉ DE CERTAINES APPLICATIONS 475: 


pour Nt(-)—z(.) Ia <a, nous avons : 


Tec CC) do 1) — dec (EC) to Hl= 

ta | ho 
| Gh+r.n a | Gin +f.h at|< 
to À 


— sup 
DRAC CII 
io 


a Ch 


1 to . 
< RP {| | (fh+f.h} a]+|\ {fxh+f.h} dt| + 


ê1 
+ (TARA TENTE X na|< 
Lo 


<max {Il fx (2, +11, (6 2, w)} (lé Él + Ho — fol) + 


+ max {fe (6 2 (0), 20) fat 2 (0), & (II 


[to, t1] 


+ 20, 2). (6 20, x (OX 


X 
Le premier terme tend vers zéro pour t9—+ toett,—+> t,. Le deuxième 
peut être estimé en utilisant la continuité uniforme, de même que 
nous l’avions fait dans la démonstration de la proposition { de 2.4.1, 
et il tend donc vers zéro lorsque x (-)— x (-) dans l’espace C1 (A, R"'). 
En appliquant le théorème sur la différentielle totale, on ob- 
tient (9). M 


2.4.3. Opérateur des conditions aux limites. Supposons que la 
fonction W (£o, Los ta 21): W— Rest continûment différentiable sur 
l'ensemble ouvert W R X R* X R X R” et soit 


w° = {(x (-), Lo; ti) | x (-) € C1 (A, R"), 
Lo» li € int À, (Los Z (Lo); Li; T (£:) € W}. (1) 
L'application Y:#°— R° définie par l'égalité 
Y (x (-), Lo; ti) Ÿ (Los 4 (lo); Li; Z (£1)); (2) 
est appelée opérateur des conditions aux limites. 


Proposition. L'opérateur des conditions aux limites (2) est 
continûment différentiable sur l’ensemble (1) et l’on a 


D (x (+), dos 21) LA (+), Tos Ti] = 
œ VTo % Dre [A (6) +2 (Éo) Tol + Pa Ts + x, [A (t1) + x (t:) Tal, (3) 
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où 
Va, —. Ÿx, (£o: T (to); lys À (t1)), i — 0, L: (4) 
LEA Te Vx, (£os 4 (Lo) li, (£:)), = 0, 1. (9) 


Démonstration. A) Considérons d’abord l'application 
la plus simple ev:CT(A, R”) X int A — R” définie par l'égalité 


ev (t (+), £o) = & (to) 


(l'application d'évaluation). Relativement à x (-), cette application 
est linéaire, et donc 


EVx(.) (C (+); Lo) [A (-)] = À (to). 
La dérivée partielle relativement à té, est la dérivée ordinaire 


EVts (æ (-), 15) [Tol = £ (&) To- 


Vérifions la continuité 


ILevac.) (& (+), do) — Va.) (& (+), ll = 


= sup [A(o) —Rk (Go) IIS 
HACMHo<! 


< sup sup [16 (0)Ito— fol lto— 410 
HA(e)ci<1 6Elto, to] 


pour fo—>t,. On à ensuite 


ILeve, (& (+), to) —evs, (&(-), )11= 
— sup [t(to) To—2Z (o) Tol = |Z (to) — x (to) 0, 
IT! 
lorsque t9—+ , et æ(-)—> x(-) dans l'espace C1 (A, R'), comme 
nous l’avons montré pendant la démonstration de la proposition 2 de 
2.4.2 (inégalités (12) et (13)). D'après le théorème sur la différen- 
tielle totale (voir 2.2.4), 


evér(-), 40) [A (-), tol = À (bo) + (Ë) To. 


On vérifie de manière analogue que l’application (x (-), {,)— x (#;) 
est également continûäment différentiable. 

B) En faisant appel au théorème de superposition, on vérifie que 
l’application (2) est différentiable et l'égalité (3) est vraie. 


Exercice 1. Supposons que l'application ev: C?([0, 1]) x (0, 1) — 
— KR est définie par la formule ev (x (+), t,) = x (to). Démontrer que:  : 
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a) pour l'existence de la deuxième variation 6? ev (x (-), to) il faut et 
il suffit que x (to) existe et que 


6? ev (x (+), to) LA (+), t] = 2h (to) % + x (to) À : 


b) l'application ev ne possède pas de deuxième dérivée de Fréchet, bien 


que dans le cas où z (éo) existe sa première dérivée de Fréchet soit différentiable 
selon Gâteaux. 


'ndication. k(to +7) — k (to) Æ o (IL A I? + 1°)1/2. 


$ 2.5. Renseignements nécessaires provenant 
de la théorie des équations différentielles ordinaires 


Comme nous avons déjà remarqué dans 2.1.8, les équations diffé- 


rentielles x = ® (t, x, u (t)) considérées dans les problèmes de comi- 
mande optimale ont leur caractère propre. Puisque nous admettons 
les commandes discontinues w (-), le deuxième membre ne vérifie 
pas nécessairement les hypothèses des théorèmes usuels des cours 
d'équations différentielles. En outre, les renseignements concernant 
les solutions ne sont pas toujours expos dal: ces cours sous une 
forme commode pour nous. Par conséquent, pour que notre exposi- 
tion soit complète et aussi pour illustrer les possibilités d'application 
des théorèmes généraux démontrés aux $$ 2.3,2.4, nous donnons 
dans ce paragraphe la démonstration des théorèmes fondamentaux : 
l'existence, l’unicité et la différentiabilité des solutions, ainsi que 
quelques assertions spéciales qui se rapportent aux systèmes linéai- 
res. Une partie des énoncés est donnée sous une forme un peu plus 
générale que celle qui est ordinairement nécessaire. Le plus souvent, 
nous avons affaire aux commandes continues par morceaux uw (+), or 
même dans ce cas il est commode de parler de « mesurabilité », 
d’« intégrabilité », etc. 

La fonction x (+) est appelée solution de l'équation différentielle 


z=#F(t, x), 


si elle est absolument continue (voir 2.1.8) et vérifie l'équation pres- 
que partout. 


Sous une forme équivalente, x (-) doit être la solution de l’équa- 
tion intégrale 


t 
2 (#)=2 (to) + | F(s, x (8)) ds. 
to 


2.5.1. Hypothèses principales. Ici et par la suite nous allons sup- 
poser que G& est un ensemble ouvert dans R X R’ et que la fonction 
F:G— R' vérifie les trois conditions suivantes: 


12—0237 
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A) Pour tout x la fonction t+-> F'(t, x) définie sur la section 
Gx = {t]|(t, x) EG} est mesurable et intégrable sur tout intervalle 
fermé fini contenu dans G.. 

B) Pour tout t, la fonction x F (t, x) définie sur la section 
G; = {x ](t, x) EG} est différentiable (au moins dans le sens de 
Gâteaux). 

C) Pour tout compact & & G, il existe une fonction localement 
intégrable k (-) telle que 


NF, 2) IKA(G), V(2Eeæ. (1) 


(Üne fonction est dite localement intégrable si elle est intégrable sur 
tout segment fini.) 

Un exemple typique est donné par la fonction F (t, x) = œ (#, x, 
u (t)), où o (é, x, u) et ®p, (£, x, u) sont continues sur G X 4, alors 
que u: R— %,/ est continue par morceaux. Les conditions A) et B) 
sont évidentes ici, tandis que k (t) peut être posée égale au maximum 
de || F, (6, x) || sur €. Un autre exemple F (t, x) — À (t) x, où À (:) 
est une fonction matricielle mesurable et localement intégrable 


ÀA:R— £(R, PR). 


Remarque. Les conditions A) à C) sont plus restreintes que 
les conditions de Carathéodory bien connues [4], mais elles s'accor- 


dent mieux, d’une part, avec nos besoins (l’étude de l’équation x — 
— p(f, x, u(t)) à commande discontinue uw (+), mais telle que la 
dérivée op. existe) et, d'autre part, avec nos possibilités (l'appareil 
du calcul différentiel du $ 2.2). 
Lemme 1. Pour tout compact & &G, mi exisie une fonction 
x (-) localement intégrable telle que 


IF 2) Ka), V(G ze. (2) 


Démonstration. Puisque €’ est un compact, il existe 
des ôê > 0 et & > 0 tels que pour tout point (é,, xo) € ° le « cy- 
lindre » 


Cu, = {DIS Ir—1<e} 


est contenu dans G. Pour ce cylindre, d’après C), trouvons la fonction 
localement intégrable k; x (8). 
Utilisant de nouveau la compacité, recouvrons é# par un nombre 


0%o 


N 
fini de cylindres: ZE /f Ci,x,. 
i=1 
La fonction 


& 
x (= 2) [IE (E, ti) + Riz, (6) el Xe, -6, #,+61 (0) 
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est celle que l’on cherche (ici Yf«, p1 (*) désigne la fonction caracté- 
ristique de l’intervalle fermé [œ, fl; | À (£, x;) | est intégrable sur 
[t; — 6, t; + ô] d’après A)). En effet 


(1) EX = Ai, (fx) EC 
UF (E 2) KIF (EE, 2) + IF 2) —F(E, s)I< 
IF (6, x) + Seb IF (6, c)Ie x (0) 


XL» X$ 


(le segment [(£, x), (#, x;)] est contenu dans C:,,, et le théorème de la 
moyenne de 2.2.3 est applicable). 

Lemme 2. Si la fonction x: A— R° est continue sur l’inter- 
valle fermé À et son graphique {(t, x (t)) | t € AŸ est situé dans l’ensem- 
ble ouvert GER X R, tandis que la fonction F:G—- R' vérifie les 
conditions À) à C), alors la fonctiont- f(t) = F'(t, x (t)) est mesura- 
ble et intégrable sur A. 

Démonstration. Pour une > 0 suffisamment petit on a 


Œ = {(mllr—-z(HISe +EA)CG; 


supposons que k (+) est la fonction qui correspond à ce compact en 
vertu de la condition C). La fonction continue x (+) est la limite 
uniforme de fonctions en escalier x, (+), et, sans restreindre la géné- 
ralité, on peut supposer que les graphiques des x, (+) sont-situés 
dans &'. 

Sur chaque intervalle où x, (+) est constante, la fonction {++ 
> fn () = F(t, x, (t)) est mesurable et intégrable d’après la con- 
dition A), donc f, (+) est mesurable et intégrable sur A. En se ser- 
vant du théorème de la moyenne (voir 2.2.3) et (1), on obtient 


fn (t) — jf () | = | F(E, Ln G)) — F(, z (£)) | 
< k (0) | an D — & (6 L 


d’où fn (t)— f (t) pour tous les £ € À, par conséquent, f (+) est me- 
surable, étant la limite de fonctions mesurables ([KF], p. 295). Enfin 


FOIS Tr CI + k(E) tn (6) — x (6) |, 
et donc f (t) est intégrable. 
2.5.2. Théorème local d’existence. Supposons que sur un ouvert 


GER X KR” la fonction F:G— R" vérifie les conditions A) à C) et 
supposons que le compact & est contenu dans G. 


IT existe alors des à > 0 et e > 0 tels que pour tout point (ë, x) € & 
et pour (to, Zo) vérifiant les inégalités 


[to —tl<6, [x—z|<e, (1) 
12% 
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la solution X (t, to, xo) du problème de Cauchy 
| z=#F(t, x), (2) 


2 (Lo) = Lo), 


est définie sur le segment [£ — 6, t + ôl et X est une fonction continue 
de ses variables. 

Démonstration. Appliquons à la situation considérée 
le principe des applications contractantes dans l’énoncé de 2.3.2. Le 
problème de Cauchy (2) est équivalent à l’équation intégrale 


x (t)=20+ ÎF (s, x (s)) ds, (3) 
Lo 


et nous appliquerons le lemme de 2.3.2 à l'application 
(-) 
(os Los  (-) 7 D (fo Go 2 (-))=2o+ | F(s,&(s)) ds. (à 
to 
Choisissons y et f de sorte que 


Hi=(t,2lt—ÉlSy, r—r< (6 DE#}SG, 


et soient k (-) et x (+) les fonctions intégrables qui correspondent 
d’après C) et le lemme 1 de 2.5.1 à ce compact. Vérifions d’abord les 
hypothèses du lemme de 2.3.2. L'ensemble (1) sera ici l’espace topo- 


logique T, U = T, Y = C(IË — 6, à + 6], R°}), où 6 (0 <ô< y) 
sera choisi plus tard; y, (s) = x, 
V = {(éo, to & (-))I to — Ê | < 6, [to —T|<e, 

x (+) — ÿo (+) Île < B}. (9) 
Les constantes e et 8 vérifient 0 < 8 1 et 0 <e << PB (1 — 6). 


La condition c) de 2.3.2 est vérifiée si, pour tE[t—6, + Ô], 
on à 
t 


\ro+ (F(6, 2) ds—2 | <p(1—0). (6) 


to 


D'après le lemme 1 de 2.5.1, nous avons | F (s, %) | x (s) et, ayant 
choisi Ô suffisamment petit, nous aurons 


+6 . ?+6 
| IF, Dlds< À x(s) ds <B (1—8) —e, (7) 
t-0 t-6 
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d’où nous tirons (6), puisque 


t t 
rot Ps, 2 452] <iao—21+] [F6 D ds) < 
to lo 
?+6 | 
<e+ | 1F(s, ds <p(1—0). 
1-6 


La condition a) de 2.3.2 signifie ici que l’application (£,, &o, & (-)) 
+ (Éo, Los D (for Lo, & (-))) envoie V dans V. Elle est vérifiée si 


t 
to ÊF (6, & (5) ds—à CB 
to 
pour (fo, To, t(-))EV et ét, ++ 6]. Estimons ici le premier 


membre en nous servant de (6), du théorème de la moyenne et 
de (1) (2.5.1): 


ko (r (s, x (s)) ds— x < 


lo 


<|%+ Îr( z) ds— x | +] fur (s, z(s)—F(s, x)} ds| < 
to do 


t+6 +6 
<p(1—6)+ | k (s)1 (8) —Zids<B (1—0+ J k(s) ds) <B, 
+6 
si l'inégalité 
?+6 
| k (s) ds &0 (8) 
t-6 


est vérifiée, ce que nous pouvons atteindre en choisissant ô plus petit 
s’il le faut. 

Enfin, puisque nous avons déjà vérifié la condition a), la condi- 
tion b) de 2.3.2 est vérifiée si 


D (los Los & (+) — À (Go; Los ÿ (-) IS 0Hz()—yt()Î 
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pour tous les (£,, tn æ(-) E V'et (to, to, y (+)) € V. Mais 
Î D (Lo Lo; z(-)) —®D (Lo Los Y (-)) [= 


= max | %+ Îr 6 x (s)) ds — xo — (rs y (s)) as|= 
o to 


= max | er (s,t(s))—F(s, y (s))} ds| < 
lo 


Las 


i+6 
< | #(s)dsIlz()—y (SO Iz(C)-7 CA 
î-6 
d’après (8). 

Aïnsi le lemme de 2.3.2 peut être appliqué et, par conséquent, 
la suite X, (+, to, Zo) définie par les égalités X, (+, to Zo) = & et 
(:) 

Kat (es dos So) = ot | F(8, Xa(s, for o)) ds, (9) 
lo 
converge uniformément par rapport à (f, x) de (1) dans l’espace 
C ([t — 6, t + 6], R"), i.e. uniformément par rapport à £{ € [£ — 6, 
t + Ô]. Passant à la limite dans (9), nous voyons que 
X (t, Los To) = lim X h (#, Los Lo) 
ñn-+00 


vérifie l’équation intégrale (3) et, par conséquent, est une solution 
du problème de Cauchy (2). Par récurrence on démontre facilement 
que les fonctions X, (£, to, æo) sont continues, et, puisque la conver- 
gence est uniforme, il en découle que X (ë, t,, 9) est continue relati- 
vement à ses variables. D 


2.5.3. Théorème d’unicité. 

Lemme (inégalité de Gronwall). Supposons que 
les fonctions non négatives à (+) et w (+) sont mesurables sur le segment 
À et le produit a (-) w (+) est intégrable sur A. Si pour certains b > 0 
ettECAet pour tous les tE À, on a l'inégalité 


t 


© (<] | a (s) o (+) ds|+b, (4) 


T 
alors pour tous les tEA on a 


t 
| | a(s)ds | 
o (t) Lbe * (2) 
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Démonstration. Supposons d'abord que > 7. Par 
hypothèse 


N — | & (s) & (s) ds oo 
À 
et, d’après (1), on a 
© ()< N + b. 


Par récurrence, nous voyons que (1) implique les inégalités 
î 


@ E<b+8 [a (s) ds + 


T ; ; : 
+ rl fete ds |" + ET (at ds |”. (3) 


En effet, pour m — 0, (3) est vérifié, et si (3) est valable pour un 
certain m, en substituant cette estimation dans (1) et en nous ser- 
vant de l'égalité 


s—=t t 
4 s fl « (0) do ]*** [ { &(o) do]**” 
{af Ta(o) do | = — | = < 
T T 


nous voyons que (3) est valable pour m + 1. En passant à la limite 
dans (3) quand m—> , nous obtenons (1). 

Pour {<< 7 le raisonnement est analogue, il faut seulement chan- 
ger partout de place les limites d'intégration. (Remarquons que la 
fonction « (+) n’est pas nécessairement intégrable, de sorte que le 
deuxième membre de (2) peut être infini.) M 

Théorème d'unicité. Supposons que la fonction 
F:G— KR" vérifie les conditions A) à C) de 2.5.1 dans un ouvert 
GERX R'; AÀ,,i = 1,2, sont des intervalles dans R et x; (+): A; — 
—+ R7 sont deux solutions du problème de Cauchy (2) de 2.5.2, dont les 
graphiques sont contenus dans G. Alors a (t) = x, (t) pour tous les 
tEANA 

Démonstration. L'ensemble À = {# | x, (ft) = x, (t)} est 
évidemment fermé dans À, f} À, et non vide, puisque #, € À. Il reste 
à vérifier que c'est un ensemble ouvert, alors l’assertion du théorè- 
me sera une conséquence du fait que l'intervalle A N À, est connexe. 


Supposons que # € À, de sorte que æ (&) = Lo (ë) — x. Choisissons 
des y>0 et f—0 de manière à avoir 


= {Ga ili—-il<y Ir—-rI<f}eGet(i a ()EX 


pour |[é— # | v; la fonction k (t) correspond à &# en vertu de la 
condition C) de 2.5.1. 
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En appliquant le théorème de la moyenne (voir 2.2.3) et l’inégali- 
té (1) de 2.5.4, nous trouvons 
t 


fes (6) — 22 DIR] ÎLE (6, a (9) —F (6, 22 (8))1 ds] < 


î 
Maïntenant, si l’on applique aux fonctions & (£) — | x, (t) — x (t) | 
sur [é — y, & + y] le lemme que nous venons de démontrer (œ (£) — 
= k (1), b = 0), on obtient, d’après (2), x, (f) = x, (it). 
Par conséquent (t — y, + y) & À,et À est ouvert. 


k (s)Ita (s)— x (s)lds|. 


+) es que 


2.5.4. Equations différentielles linéaires. Dans ce sous-para 
graphe À est un intervalle fermé de la droite numérique, 


A:A— £(R7, R), b:A— R'et c: A R'* 


sont respectivement une fonction matricielle intégrable et deux fonc 
tions vectorielles intégrables ; 


=, «4 M)ERT D—=(p,, :::: DD) CR 

Nous allons considérer les systèmes d'équations différentielles liné- 
aires 

x = À (t) x + b (t) (1) 
et 

p = —pA (t) + c (i) (2) 
(parfois le système (2) est dit ad joint au système ({)). Il est 
bien connu que l’existence de la solution pour les systèmes linéaires 
peut être démontrée globalement, dans notre cas sur le segment A 
tout entier. 

Lemme. Si les fonctions A: A— £ (R7, R”), b: A— R° ei 
c: A— R°# sont mesurables et intégrables sur le segment À, alors tout 
problème de Cauchy pour les équations (1) et (2), posé au moment 1, € À, 
possède une solution unique et cette solution peut être prolongée au 
segment À tout entier. 

Démonstration. Puisque dans les deux cas tous les 
raisonnements sont analogues, nous nous limiterons à l'équation ({). 
Pour simplifier, prolongeons les fonctions À (+), b (-) et c (-) sur R 
tout entier, en les prenant nulles en dehors de A. Alors la fonction 


F (t, x) = À (t)z + b (t) 


vérifiera les conditions À) à C) de 2.5.1 dans le domaine G = R X KR”, 
on peut donc appliquer à l'équation différentielle (1) le théorème 
d’unicité de 2.5.8 et le théorème local d’existence de 2.5.2 en chaque 
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point G, 2), de sorte que la solution de l’équation (1) pour laquelle 
£ (# — x est nécessairement unique et définie sur un certain inter- 
valle fermé [ét — 6, & + ô]. 

Remarquons maintenant que si [zx |< M, on à 


IF DISIAOIM+IbEE Fx(6 2 11 = 1 A © 


Revenons maintenant à la démonstration du théorème de 2.5.2: 
nous pouvons choisir arbitrairement les constantes y, B, 6 et €, par 
exemple, en posant 6 — 1/2, f — 4, & = y — 1, alors les inégali- 
tés (7) et (8) de 2.5.2 qui déterminent Ô se mettent sous la forme 


?+6 î+6 
M | HA(GIIds+ | 1b(1ds<1, 
3-6 | 1-06 (3) 
t+Ô 
| | À (s) Il ds 1/2. 
7-6 


| À (-) [let | db (-) | étant intégrables, nous pouvons choisir ô > 0 si 
petit (et inférieur ou égal à y — 1) que les inégalités (3) soient satis- 
faites pour tous les £ ((KFI, p. 294). Par conséquent, la solution de- 
l’é équation (1) pour laquelle x () = x est définie sur le segment 
[è — 6, à + 6] avec un 6 garanti, qui est le même pour tout à et 
tout : tel que [zx | M. 

Supposons maintenant donnés t, € À et x,; cherchons la solution 
de l’équation (1), qui vérifie 

T (to) = Lo. (4) 
Posons 
fac 


= (sol + | 18 (s)1ds ) eà (5) 
A 


Le problème de Cauchy (1), (4) est équivalent à l’équation intégrale 
î 


L 
x (t) = Xo + [4 (s) x (s) ds + je (s) ds, 
d’où l’on tire É 


Loi<la+| {4020 +] | b (s)ds|< 


<(la1+ | 18 ()1ds)+| [14 (Sds|. (6) 
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La solution x () du DD (1), (4) est nécessairement définie sur 
le segment A, = [é — , to + Ô]. En appliquant sur ce M D le 
lemme de 2. 5. 3 à la ra PE © (Et) = [x (é) | (a (t) = |} À (6) ||, 


b = | xo | + | [ b (s) | ds), nous obtenons l'inégalité 


A 


t 
| fiat) las | 


OI (Irol + | 16 ()1ds ) e * (7) 


À 

et, en particulier, | x (t, + Ô) | M d’après (5). Par conséquent, 
aux points (és + Ô, x (to  Ô)) on peut à nouveau se servir du théo- 
rème local d’existence et prolonger la solution x (-) au segment 
À: = [to — 26, to + 28]. 

Ensuite la procédure est répétée. L’inégalité (6) est vérifiée sur À, 
et donc on a (7) sur A, et | x (t, + 26) | M, etc. En un nombre 
fini d'étapes nous prolongeons la solution du problème de Cauchy ({), 
(4) au segment A tout entier. M 

Des formules explicites pour la solution des systèmes (1) et (2) 
s’obtiennent à l’aide de la matrice fondamentale des solutions du 
système homogène 


x = At) x. (8) 

Définition. On appelle matrice fondamentale Q (t, *%) des 

solutions du système (8) la fonction matricielle Q:A x A—+ 
—+ & (R7, R”) qui est la solution du problème de Cauchy 


LED LAGa(, ©, (9) 


Q “ T7. (10) 

Autrement dit, chaque colonne de la matrice Q (ft, +) est une 

solution du système (8), et pour { = +, ces n colonnes se transforment 

dans la famille des vecteurs unités de la base standard de R': e, — 

— (0 50 0e = 00 1 528 0) as re = (0,0, 2. 2, 0). 

Théorème. Sila fonction matricielle À (+) est intégrable sur 

le segment À, alors la matrice fondamentale Q (t, r) du système (8) existe, 
elle est continue sur le carré À X À, et on a: 


D QG, 5 Q(s, t) = Q (é, t) pour tous lest,s, TE À; (11) 
2) pour chaque t, Q (t, t) est une solution de l'équation différentielle 

LED 2 _Q(,0A(x. (12) 
En outre: 


3) Si la fonction b: A—+ R? est intégrable sur le segment À et x (:) 
est une solution du système (1), alors pour tous t, TE A on a 
t 


2 (D =Q(t, D x(t)+ je (4, s)b(s) ds. (13) 
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4) Si la fonctionc: A— R'* est intégrable sur le segment À et p (:) 
est la solution du système (2), alors pour tous t, TE Aona 


T 
p=p(DQ(r, D— [e(s)Q(s, 9 ds. (14) 
î 
Démonstration. Par une substitution directe, en se 
servant de (9), on vérifie que pour tout & € R" les fonctions 
D) =Q(E s)Q(s, 7) 6 et x (t) = Q(E, 7) Ë 
sont des solutions du système (8), et puisque, d’après (10), 
T1 (s) = Q (s, S) Q (s, T)E — Q (s, T) ë — Lo (s), 
on peut conclure en utilisant le théorème d'unicité que 
Q (6, s) Q (s, t) & = 1 (Ë) = 2 (é) — Q (6, T) c 
Puisque Ë est arbitraire, on doit avoir (11). En posant t — x dans (11), 
nous obtenons Q (£, s) Q (s, {) — E, d’où 
Q (ë, s) = [Q (s, é)]71 
Si nous fixons s dans (11), nous pouvons représenter la fonction d’une 
paire de variables Q (f, rt) sous forme de produit de deux fonctions 
d’une seule variable, et puisqu'elles sont toutes deux continues, 
Q sera continue relativement à (£, t) sur À X À. En particulier, cette 
fonction est bornée. 
D'après la proposition 3 de 2.2.1, la fonction matricielle f (A) — 


-L est continûment différentiable sur l’ensemble des matrices 
inversibles et 


f" (A) [AT = — A1 HA”. (19) 
L'ensemble &# = {A | À = Q (s, t), s, t € A} est l’image du com- 
pact À X À par l'application continue Q: À X A— £ (R7, R), 
donc c’est un compact: la fonction f est bornée sur ce compact, 
Il f (4) I< M et vérifie les conditions de Lipschitz puisque 
1f(4)—f(B)I=NBT—-ATI=1I—-BT(E — A4) ATI< 
< M°|]B — À ||. 
D'après l’hypothèse 1 de 2.1.8 la fonction 
ps =Q( ss) =Q(s, ti)" =f(Qt(s, à) 
est absolument continue ; en vertu de (15) et du théorème de super- 
position de 2.2.2., on a presque partout 
29 jo (7 ED Os, ppt 
= —[Q(s, MAG t)[S(s, #7 = —Q (,s) A(s), 


ce qui démontre (12) 
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En représentant le deuxième membre de (13) sous la forme 
L = 
Q(£, [x (m+ | (x, s)b(s) ds |, (16) 
T 


nous voyons que c’est une fonction absolument continue. En efiet, 
Q (x, s) b (s) est intégrable (comme fonction de s) sur À, or, l’inté- 
grale d’une fonction intégrable est toujours absolument continue 
(voir 2.1.8). Par conséquent, l'expression entre crochets de (16) est 
absolument continue relativement à é. Il reste à remarquer que le 
produit de deux fonctions absolument continues est également abso- 
lument continu (proposition 1 de 2.1.8). 

En prenant la dérivée de (16) compte tenu de (9) et (11), nous 
voyons que le deuxième membre de (13), de même que x (+), vérifie 
l'équation (1). Puisque ces fonctions coïncident pour t — 7, elles 
coïncident pour tous les & € À d’après le théorème d’unicité. 

La relation (14) se démontre de manière analogue. 


2.5.5. Théorème global sur l’existence et la dépendance continue 
de la solution des données initiales et des paramètres. Revenons 
à l'étude du problème de Cauchy 


z=F(t, 2), (1) 
z (lo) = Lo (2) 


pour les équations différentielles dont les deuxièmes membres véri- 
fient les conditions A) à C) de 2.5.1. En utilisant le théorème local 
d'existence et le théorème d'’unicité, nous pourrons, comme on le 
fait dans les cours d'équations différentielles, prolonger la solution 
X (+, Lo, To) du problème de Cauchy (1), (2), à l'intervalle maximal 
(a, b) où cette solution existe. Alors il découle du théorème de 2.5.2 
que, pour £} aet pour { À b, cette solution doit sortir de tout com- 
pact & © G, car, tant que (f, x (t)) € €, on a la garantie de pouvoir 
prolonger la solution à l'intervalle (4 — Ô, t + ô), d’où l’on tire 
a + Ô<t<b—6ô, puisque l'intervalle (a, b) est maximal. Le 
théorème suivant nous montre dans quel sens X (+, £,, xo) est une 
fonction continue de (£,, Zo). 

Théorème 1. Supposons que la fonction F:G—- R7 vérifie 
les conditions À) à C) de 2.5.1 sur l’ensemble ouvert GER X R'et 


SUPpOSOnS que x: [é, ls R” est une solution de l'équation (1) dont 
le graphique T = {(t, x (é)) | LE 1< &} est contenu dans G. 

Il existe alors un 8 > Oetun voisinage G= Ttels que pour tous les 
(lors To) € G la solution X (:, Lo» To) du problème de Cauchy (1), (2) 
est définie sur le segment À — fé — 0, L: + ô] et la fonction (t, to, 
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Lo) > ZX (E, Los Lo) est une fonction continue de ses variables sur À X G. 


En particulier, pour ti, — T, xo— x (t), on a X'(t, to, &o) — x (£) 
uniformément par rapport à t € À. 
Démonstration. A) En appliquant le théorème local 


d'existence aux points (£o, x (ko) et (4, z (4.)), prolongeons la solu- 
tion x (-) à un intervalle fermé À — [és En à : + 6] de façon que 
le graphique de z (-) soit toujours contenu dans G. Choisissons ensui- 
te € de manière que le compact 


Æ = {6 D llr—-Tr(HI<é t€A 
soit contenu dans G. Appliquons à # le théorème de 2.5.2 et trou- 
vons un Ô >> 0 tel que pour tout (4,, x,) € la solution X (:,&£,, 
x) soit définie sur [fo — Ô, to + Ôl. Enfin, supposons que k (t) et 
x (-) sont des fonctions localement intégrables qui correspondent 
à € en vertu de la condition OC) et du lemme 1 de 2.5.1. Désignons 
maintenant 


G={(t, t)lt E(to—Ô, +0), |x—x(f|<e} 
et montrons que pour & >> 0 suffisamment petit ce domaine possède 
les propriétés indiquées dans l’énoncé du théorème. 

B) Supposons que deux solutions x; (+), i — 1, 2, de l’équa- 
tion (1) sont définies sur l’intervalle fermé [B, yl  Aet (it, x; (t) € 
EX, B<Li<7Y, de plus, soit t E [B, yl. En appliquant le théorème 
de la moyenne (voir 2.2.3) et l'inégalité (1) de 2.5.1, nous obtenons 


121 () — 22 (6)] — 
t t 
— {a (0+ ÊF (6e 21 (99) ds 22 (5) — À F(s, 2 (s))ds| < 


T T 
t 


Lie (0) — 22 (01+] ÎLE (6, 21 (9) —F (6, 22 (9) ds < 


T 
t 


<a (na (d1+] |A Ga (9-2 (91és|. (3 
En vertu du lemme de 2.5.3 


as =k(s), w(s)=lu(s) —x (st, b= Tax (T) — x (7 | 
on a donc 


[ atoas | 
[tr CE) — 2e GI Lx (T) — 2 (le * rs PSY. (4) 
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C) Choisissons maintenant un € > 0 de manière à avoir 
facwds 
ee LE, (o} 
et soit (£,, &o) € G. Puisque G €, la solution x ()= ZX (-, to, to) 


est définie sur [B, yl — [é, — 6, t + ô] N A. Montrons que cette 
solution restera dans € sur ce segment. En effet, supposons que 


T = sup {t|t, Lt min {é, + 6, 4 + 64: 

(s, x(s))E&, VsE fé, th. (6} 
Sur le segment [t,, T], on peut appliquer aux solutions x (-) et 
x (-) les raisonnements de la partie B) de la démonstration; en se 
servant de (4), on obtient alors 


T 
k(s)ds i R(s)ds 


kr (T)— x (T)IKlro—Z(tole <Leed Le. 


Mais alors (7, x (T)) € int &# et le point ({, x (t)) reste dans € éga- 
lement pour les { > T proches de T, ce qui est en contradiction avec 
la définition (6). On raisonne d’une manière analogue pour t  t,. 
Puisque (B, x (B)) €’ et (y, x (y)) € &Æ, la solution x (+) est 
définie sur le segment [t, — 26, t, + 21" À. On peut à nouveau 
appliquer à ce segment la même argumentation: elle montre que 
(&, x (t)) reste dans €. En continuant ce procédé, nous voyons que 
x (+) est défini sur A. 
D) D’après ce que nous venons de démontrer, toute solution 
X (+, to, Æo) reste dans &Æ si (&,, xo) € G. Si l’on se rappelle de la 
fonction %x (-), on obtient l'inégalité 
LA (és dos Lo) — À (6, Los To)| — 


=| (r (6, X (s, to ti) ds | < | f, ads]. (D 
t t 


Choisissons maintenant deux solutions pour lesquelles (f,, &) € 

EG et Te xo) EG. Alors, en vertu de (4) et (7), on a l'inégalité 
IX (6, Los To) — X (t, to o)| 

LIX (£, Los Lo) — À (£, to, Lo) + |ZX (é, to: % 


< 


À (£, Los To) [<< < 


)— 
| L'acaas| 
x (5) ds] + 1% —X (os os Tole%  < 


7 . fa 
<| | x (s) ds| + {1% %o| +| j* x (s) as|) eh, (8) 
É do 


$ 2.5] THÉORIE DES ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES 192 
qui tend évidemment vers zéro pour re t, to, To —+ To, ce qui 
démontre la continuité de X (£, to, ïxo). En posant dans (8) t=i, 
= T, Ty=%x(T) et en se rappelant que d’après le théorème d’uni- 
cité on a X(#, T, 2 (r))=7(t), on obtient 

k(s)ds 


T 
FOX (6 to IE (D—l+ (n(s) ds}, 
d'où l’on voit que X (é, to, xo) —+ x (&) uniformément quand x, —- 


—+ x (t), LL —> 7. M 

Passons maintenant à la dépendance continue des solutions en: 
fonction du paramètre. Supposons que nous avons une famille d’équa- 
tions différentielles 


z= PF, (t, »), (9 


qui dépendent du paramètre &œ € À, où À est un espace topologique. 
Théorème 2. Supposons que sur l’ensemble ouvert GR X 
X R” les fonctions de la famille £{F,: G— R'|xE€X} vérifient 


pour chaque à € À les conditions A) et B) de 2.5.1 ; soit x: [é,, t.] — 
—+ R" une solution de l'équation (6) pour à — a; envisageons le graphi- 
que L = {(#, T (&)) | t Li< Li c Get supposons en outre que sont 
vérifiées les conditions suivantes: 

C”) Pour tout compact &# &G il existe des fonctions localement 
intégrables x (+) et k (+) telles que pour tous les (t, x) E&, a EU 
on a les inégalités 

[Fa (, t)ISA(), | Fax (6, DIE (6). (10) 
t 
D) lim | Fa (s &(s)—F, (s, Z(s)1ds= 0. (11) 


aa * 
Lo 


IT existe alors un = O0, un voisinage GT dans G et un 


en U3 a dans À tels que pour (to; Lo) EG, a EU la solution 
La (ts los To) du problème de Cauchy (9), (2), est définie sur l'in- 


tervalle fermé A= [ty — 6, {, + 6] et quand STE: +], Lo —+ 
z(r), Ga, On a 


Xa (ts to To) + & (t) 


uniformément par rapport à + Elfe, 4]. 
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La démonstration de ce théorème s'effectue suivant le 
même schéma que celle du théorème 1, avec des modifications mineu- 
res. Dans la partie À) nous prenons en considération le fait que le 
nombre Ô dans le théorème local d'existence se détermine par les 
inégalités (7) et (8) de 2.5.2 et, en vertu de la condition C’), peut 
être choisi le même pour tous les & € Y. 

Dans la partie B) nous remplaçons la solution x, (+) par la solu- 


tion x, (-) de l’équation (9) et la solution x, (+) par x (-). Lorsqu'on 
estime la différence, il faut prendre en considération que les deuxiè- 
mes membres des équations sont maintenant différents et donc 


ra (t)—2 (1 
Lie (9—2 (014 {Fes 2()—F, (6, 2(8)} ds] + 


T 
t 


+] [eee (0-2 (6)106| 


T 


tandis que (4) est remplacé par l’inégalité 


fre (&)—2 (DIE (Ita (7) —2 (7) + 


t 
t | R(s)ds | 


+] [tres 2(9)—F; (s, &(s))} ds|) e * . (4) 


T 
Dans l'inégalité (5) il faut remplacer & par 2e, tandis que Ô 


et U doivent être choisis en se servant des conditions C”) et D) de 
manière à avoir les inégalités 


| (er. (s, (s))—F (s, z (s))} ds | < 


H+6 a h+ô 
< \ Fa (s, &(s)—F (6, (s)1ds<2 ( | + | x (s) ds) + 
7-6 ee 


& 
+ Tres z()—F, (6 2()lds<e. (12) 


Lad 


lo 


Alors le raisonnement de la partie C) (où (4) a été remplacé par (4”)) 
reste valable simultanément pour tous les « € U. 
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Dans la partie D), il faut préciser l'inégalité (8) à cause du rem- 
placement de (4) par (4”); nous obtenons alors 


[Xe (£, tor To) — (#1 


<{Iro—2 (T)1 + | | # (s) ds|+ 
to 


ê 
: | R(syde 
+ (IFa(s 2 (9)—F, (8, 2 (s))1ds} ef 
lo 
et le reste est évident. 


Corollaire. Si l’on a toutes les hypothèses du théorème 2, 
la condition D) étant donnée sous la forme plus forte: 


3 


D') pour toute fonction T: Léo, t] +R" dont le graphique est 
situé dans G et pour tout a EU 
% 
lim À Fa (ss, E(9))— Fe (s, 3 (s))1ds=0 


aa 
lo 


alors la solution x, (t, to, xo) du problème de Cauchy (9), (2) est 
une fonction continue de (t, to, Zo, &) sur À X G x U. 
Démonstration. Pour tous les (Lo, %o) € G ue U, 
le graphique de la solution x (+) = X: (+, to, %o) : A—> R" est 
contenu dans G. Nous pouvons maintenant appliquer le théorème 2 


en remplaçant x (- .) par z(-) dans ses hypothèses. 

L'identité suivante est semblable à la propriété principale de 
la matrice fondamentale d’un système linéaire (voir la formule (11) 
du sous-paragraphe précédent) : 

X (£, T; X (T, Los Zo)) — X (£, Los Lo). (13) 
Elle découle automatiquement du théorème d’unicité, puisque chacun 
des deux membres est une solution de l’équation (1) et pour é = + 
les deux solutions sont égales. Nous recommandons au lecteur d’étu- 
dier la relation qui existe entre cette identité et le principe de Huy- 
gens (voir 1.1.3). 

2.5.6. Théorème sur la dépendance différentiable des solutions 
en fonction des conditions initiales. Jusqu'ici notre exposé était 
basé sur les hypothèses relativement faibles A) à C) de 2.5.1. Pour 
aller plus loin et établir la différentiabilité des solutions du problème 
de Cauchy X (£,.t,, x) relativement à la valeur initiale x,, il sera 


13—0237 
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nécessaire de renforcer ces hypothèses. Nous aurons alors la possibilité 
d'appliquer le théorème classique des fonctions implicites. Dans la 
démonstration du théorème de ce sous-paragraphe, nous ne nous 
occuperons pas de l’existence de la solution X (£, to, 0) pour (&,, xo)E 


€ Get de la possibilité de son prolongement à tous les £ € À, puisque 
l’un aussi bien que l’autre découle du théorème 1 de 2.5.5. Toutefois 
il sera utile au lecteur de vérifier que ces deux faits découlent égale- 
ment du théorème des fonctions implicites et que l’on peut donc se 
passer de tout renvoi au sous-paragraphe précédent. (Des raisonne- 
ments analogues seront effectués en entier dans 2.5.7 où, pour des 
hypothèses encore plus fortes, nous démontrerons la différentiabi- 
lité relativement à t,, le théorème des fonctions implicites étant 
appliqué sous une autre forme qu'ici.) 

Théorème. Supposons que sur l’ensemble ouvert G&R X R”° 
la fonction F: G—- R” vérifie les conditions A) et ©) de 2.5.1 et la 
condition suivante : 

B”) Pour tout t la fonction x F (t, x) est continûment différen- 
tiable sur la section G = {x |(t, x) € G}. 


Supposons que x: Li t.] — R" est une solution de l'équation (1) 
de 2.5.5 dont le graphique TV = {(+, z (t)) lto Lt <t:} est contenu 
dans G et supposons que Ô, & et G sont les mêmes que dans le théorème 1 
de 2.5.5; soit À = [t, — 6, t, + ôl. 

Alors, pour tout t, € À fixe, l'application xor X (+, lys To) de 
B (x (to), &) dans C' (A, R°) est continûment différentiable selon Fré- 
chet et l’on a 

OX (t, to To) _Q (#, to (1) 


ÔXo 
où Q est la matrice fondamentale des solutions des équations en varia- 
lions 
2 Fi(t, À (E to, Zo)) 2. (2) 
Démonstration. Supposons que le compact & et la 
fonction k (t) sont les mêmes que dans le théorème 1 de 2.5.5. L’en- 
semble 


ÿ = {x()EC(A, R)IG z()EG 1€ A}, 


est évidemment ouvert dans C (A, R”). L'égalité 
t 


F (Los & (-)) @=zo+ |F(s, x (s) ds—x (t) (3) 


Lo 
définit l’application # : R° X & — C'(A, R®). Il est évident que 
4 (To; T (-)) = 0 — À (ë) —— X (ë, Los Lo). (4) 
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Supposons que 0 € B (x (&), e) est fixe et x G)= ZX (#, lo, Lo). 
Vérifions que dans un voisinage du point (x,, x (-)) on peut ap- 
pliquer le théorème classique des fonctions implicites de 2.3.4. 
En effet, la fonction #4, (to, x (+)) [6,1] = E, est évidemment con- 
tinue. Calculons maintenant la dérivée de Gâteaux 


F xt) (Zo, x (-)) [Ë (-)] (?) * 


= lim F (to: LOTEU EF (zo: t (-)) (4) = 


t 
_ lim | F(s, x OT ONF (s, x (s)) ds — E (4) = 


rie 


t 
= [Fe(s, z(9)E(S) ds—E(. (5) 
to 


Pour établir l'existence de la limite uniforme relativement à é, 
remarquons que d’après le théorème de la moyenne (voir 2.2.8), on a 


l 
| Fr (HE (D—F Gr) je 
œ 


to 


— [Fa (s 2 (9)E (9) ds|< | ra (9 ds, 


to 


l'a (S) = max Fr (s, ©) —Fs(s, z(s))I IE (s)1. 
cELx(s), x(s)+@E(s)] 
En vertu de la condition B”), r, (s) — 0 pour tout s et « | O, tan- 
dis qu’en vertu de (1) de 2.5.1 on a |r, (s) | << 2k (s) || E I. D’après- 
le théorème de Lebesgue sur la convergence  bornée ((KFT], p. 295) 
nous voyons que la limite (5) existe et est uniforme par rapport à t. 
L'opérateur 
t 
Fat Go 2 (DE (DO = | Fa (s, & (9) E (9 ds 
to 
est borné 


IF x 6) (os & (C-)) IE CONS 


<max| | IF (s, (SI IE () ds|< À Æ(s) ds IE 


Lo 
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et dépend continüment de (xs, æ(-)) puisque 


ILE + 00 Go 2) —Fe ce (Go 2 (MI 
L t 


= sup sup| | F.(s, 2 ())E(s) ds— | Fa (s, z(5))E (9 ds|< 


mnt + le 5 


<|IFa(s, (9) —F(s, &(s))IIds. 
A 


Pour Lx (°) — x(-)|[—-0, on a en vertu de B) 
IF (s, æ (s)) — Fs(s, x(s) I 0, VsEe A, 
et en appliquant à nouveau (1) de 2.5.4, on obtient 
IF, (s, x (s)) — Frs, x (s) 1 < 2% (s), 
de sorte que le théorème de Lebesgue est applicable. En nous ap- 
puyant sur le corollaire 2 de 2.2.3, nous établissons que la dérivée de 
Fréchet # ,{., existe et est continue. 
Supposons que n (*) EC (A, R”) est arbitraire. En vertu de (5), 
Pro z(-)IEC)=nt)< 
t 
æ (F5 20) (5 ds—-E()=n(; (6) 
to 
pour appliquer le théorème des fonctions implicites, il faut vérifier 
que cette équation possède une solution unique. En substituant 
Et) +n(t) = C (ét), nous l’amenons à l'équation intégrale 
t 
LD = À Fes, æ(s)) LE (5) —n (9)] ds, 
to 


qui à son tour est équivalente à l'équation différentielle linéaire 


CE) = Fi, x ()) (6) — Fit, x ())n (@) C(to) = 0. (7 
Il reste à appliquer le lemme de 2.5.4. D’après le théorème de Banach 
(voir 2.1.5), F;(., est borné. 

D'après le théorème des fonctions implicites, il existe une appli- 
cation : U—+C(A, R”) continûment différentiable dans un voisi- 
nage ÜU32x, et telle que F (xo, p (xo)) = 0. En vertu de (4), 
o (to) t)=X (t, ts, x) et l’application x, > X (#, to, co) est ef- 
fectivement différentiable selon Fréchet au point x,. D'après le 
même théorème des fonctions implicites, 


ee 0 = P° (to) LÉol (É) = —(F xt) Fr, Léol) (t) = E (6) 
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et, comme nous l’avons déjà prouvé, Ë(t) est la solution de 
l'équation intégrale (6) qui se met sous la forme 
t 


| Fa (s, 2 (SE (S) ds —8 (D = — 


to 


Par conséquent 


Ft DE E (to) = Eo 
et, d’après le théorème de 2.5.4, on a & (t) — Q (t, to) &. Donc 


oX 
to (£, lo) Lo) — Q (é, Lo). E 


2.5.7. Théorème classique sur la dépendance différentiable des 
solutions en fonction des données initiales. Dans ce sous-paragraphe, 


\ 


nous envisageons à nouveau le problème de Cauchy 
z = F(t, à), (1) 
T (Lo) — Los (2) 


mais maintenant dans la situation classique, lorsque F (f, x) et 
sa dérivée partielle F, ({, x) sont continues dans G. Pour commodité 
de lecture, la démonstration du théorème énoncé ci-dessous sera 
effectuée indépendamment des démonstrations des théorèmes de 
2.5.5 et 2.5.6. Les renvois au théorème local d'existence (2.5.2) 
et le théorème d’unicité (2.5.3) peuvent être remplacés par des renvois 
à un manuel quelconque d'équations différentielles. 


Théorème. Supposons que la fonction F: G—R" ainsi que 
sa dérivée partielle F, sont continues sur l’ensemble ouvert 


GCRXR" et supposons que z: Lo, t]—R* est la solution de 
l'équation (1) dont le graphique T'={(t, x(t)) | 4 tt} est con- 
tenu dans G. 


Îl existe alors un ô—0 et un voisinage G=T tels que pour 
tous (ti, To) EG La solution X (; Lo To) du problème de Cauchy (1), 
(2) est définie sur A = [to — 6, ti + 6], est une fonction continü- 
ment différentiable de ces variables dans le domaine (0: F, +6) X 
xXG et l'on a 


X(t,T,z(T)=x(t), (3) 
(tx, 2 (D) =F (6, 2 (0), (4) 
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D (Es to Don 0 DFE) O 
Pc 6 1 20 = (6) 


où Q (t, v) est la matrice fondamentale des solutions du système d'’équa- 
tions en variations 


z=E,(t x (t)) z. 
Démonstration. A) Ayant appliqué le théorème local 
d'existence aux points (bo, z (£o)) et (4, æ (t1)), prolongeons z(:) 
à l'intervalle fermé A = [t)—6, t + ô] de façon que le graphique 


{(&, z(#)ltE A} soit toujours contenu dans G. Choisissons ensuite 
un € >> 0 de sorte que 


A ={(t, aItEA, Ir—r(]<e} CG. 


Sur le compact &', les fonctions F (t, x) et F,(t, x) sont uniformé- 
ment continues. 
B) Maintenant, dans le domaine 


= {(& (+), to %)l 7 (1) —2(H1<e, 
VIEA;, beEintA, mERTCCI(A, R)XRXR", 
définissons la fonction #: &—C(A, R°) X R” en posant 
dx (t) 
ge PE wi (7) 


T (to) — Lo 





F (x(-); tos To) o=( 


Il est évident que l'égalité # (x (+), to, zo) = 0 est équivalente au 
problème de Cauchy (1), (2). En particulier, d’après l'hypothèse 
du théorème, (x (-+), t, x (t)) = 0. 

La fonction # est continûment différentiable dans le domaine &. 

En effet, (7) contient les applications linéaires x (+) —- dx (-)/di, 
To > —%o, l'opérateur des conditions aux limites (x (+), fo) > x (to) 
et l'opérateur de Nemytski {x (#)} —> {F (t, x (t))}, qui sont conti- 
nûment différentiables en vertu des sous-paragraphes 2.4.1, 2.4.3. 
On a alors 


LEE 
Fxç)((); Lo» To) [E (-)] =(s pu no ) , (8) 


0 
Fo (&(-); to To) =. ) (9) 
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FC) to 2) El (4). (10) 
C) Soit z=æ(t), de sorte que (é, 2) ET. Vérifions si l’opéra- 
teur Frc)(t(-), t, x) est inversible. L'égalité 
Fo6O, 8 801 (0 )ec ca, rx 
est équivalente au problème de Cauchy 


E—F(t, x(t)E=6(t, E(Ô =, (11) 


qui, d’après le théorème de 2.5.4, possède la solution 


E()=Q(é, D y+|Q(E, s)C(s) ds. 


Ainsi F \(., applique l’espace de Banach CT (A, R°) sur tout l’espace 
de Banach C'(A, R”) X R”. Puisque pour & (+) —0 et y = 0, 
le problème (11) ne possède que la solution triviale et donc F4.) 
est bijectif. D'après le théorème de Banach (voir 2.1.5), l'opérateur 
#;xt, existe et il est borné. 
D) D'après le théorème classique des fonctions implicites (2.3. 4), 
il existe un Ô > 0 et une application continûment différentiable 
D: {os Lo) llto — 16, |zo — tr | Lô}—+ CT(A, R°) 
tels que 
F (D (o, Lo)» to Lo) = 0. 


Désignons 
X (£, Los To) — (Lo To) (£). 


Alors X (é, to, to) est la solution du problème de Cauchy (1), (2) 
et l’on a 





= FE X(E, for To)), (12) 
= Re (os 0) (1), (13) 
ee = Ge (or %) (E). (14) 


Si qi 20) + (boy to), alors ® (bo, ro) + D (bo, z) dans CT(A, R”), 
ie. À (#, to, t)—X (t, os Zo) uniformément sur A. D'où l'on 


déduit la continuité de X (#é, to, xo) relativement à l’ensemble de 
ces arguments. Le même raisonnement et les formules (12) à (14) 


200 APPAREIL DE LA THÉORIE DES PROBLÈMES D’EXTRÉMUM [GH. II 


montrent que les dérivées de la fonction X (6, ts, to) sont égale- 
ment continues. 
E) Les raisonnements précédents étaient applicables aux condi- 


tions initiales (é,, xo) situées dans un ô-voisinage du point (£, x) ET. 
Ce point était arbitraire, et l’on peut donc recouvrir tout le graphique 
[' par de tels voisinages. Si XCD (4, £,, 0) et XC (6, to, x) sont 
définies dans deux de ces voisinages qui possèdent un point commun 
(£os To), alors 


X0 (Los Los Zo) — Lo — XE®) (os Los Lo) 
et, d’après le théorème d'’unicité de 2.5.3, 
X® (£, Los To) au X( (£, Los To) Vi € À. 


Par conséquent, X (f, to, so) est bien définie pour tout (£,, x) 
appartenant à un certain voisinage de l', c’est donc une fonction con- 
tinûment différentiable dans ce voisinage. 

F) Il ne reste qu’à obtenir les formules (3) à (6). L'égalité (3) 
s'obtient du théorème d'’unicité, alors (4) est une conséquence de 
(12). D'après le théorème des fonctions implicites, 


09 . 
7% (or Lo) = — Fr) F io 


et donc (13) et (9) nous donnent 


hr zla=—-F; (0), T TER | 
ot #6 he z (0 a) 


Par conséquent, es (é, T, x (t)) est une solution du problème de 
0 


Cauchy (11) relativement à £ avec £—=0 et Y=—2 (t)=—# (x, x (x)); 
on a donc (9). 
D'une manière analogue 


00 ” 
Ga Vo» Lo) = —F 34° F 01 


et on obtient donc de (14) et (10) 
ox » 7. - 0 
Ses V T, x (t)) [y1= — Fi) (&(), T; x (t)) se) 


Ainsi, TE (, T: x (x)) est une solution du problème de Cauchy 
(11) relativement à £ avec £—0, d’où l'on tire 

ôX di 

0% (£, T;, x (T)) [y] = (2 (é, T) Ÿ: 


ce qui est équivalent à (6). EH 
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$ 2.6*. Eléments d’analyse convexe 


L'analyse convexe est la branche des mathématiques qui étudie 
les ensembles et les fonctions convexes. Le rôle de ces notions a déjà 
été exhibé dans 1.3.3 (théorème de Kuhn-Tucker) et, vu que dans 
la majorité des travaux contemporains sur les problèmes d’extrémum 
la convexité joue un rôle important, nous donnons ici, en outre des 
notions élémentaires, une esquisse de la théorie de dualité (théorème 
de Fenchel-Moreau) et envisageons les plus simples propriétés de la 
subdifférentielle, notion qui généralise au cas des fonctions convexes 
la notion de différentielle. Dans les $$ 3.3, 3.4, 4.8, nous montre- 
rons comment ces notions sont appliquées. L'exposition du pré- 
sent paragraphe se base sur les sous-paragraphes 2.1.3 et 2.1.4. 


2.6.1. Principales définitions. Soit X un espace vectoriel réel. 
Définition 1. a) L'ensemble C &X est appelé convexe 
s’il contient, avec chaque paire de ses points x, et x,, tout le segment 


(a, al = {rlz = am +(—ajx, 0<a<i}. 


b) L'ensemble À & X est une variété affine s’il contient, avec 
chaque paire de ses points x, et x, toute la droite 


{tr = ax + (1— az, a«€R}. 


c) L'ensemble À & X est un cône (à sommet à l’origine), s’il 
contient, avec chacun de ses points x,, toute la demi-droite 


{ax | & >> 0}. 


L'ensemble vide est, par définition, un ensemble convexe, une 
variété affine et un cône. L'ensemble de tous les ensembles convexes 
de X est désigné par 8 (X). 

La proposition suivante découle immédiatement de la défini- 
tion f. 

Proposition 1. a) L’intersection d'un nombre quelconque 
d'ensembles convexes (respectivement variétés affines ou cônes) est elle- 
même un ensemble convexe (respectivement une variété affine ou un 
cône). 

b) L'image f (A) et l’image inverse f ! (B) d’ensembles convexes 
(variétés affines, cônes) À € X, B © YŸ pour une application linéaire f : 
X — Y est un ensemble convexe (une variété affine, un cône). 

c) Toute translation C + & d’un ensemble convexe C (d’une variété 
affine) donne un ensemble convexe (une variété affine). 

d) Un cône K est un ensemble convexe si et seulement si 


Lis TE K = (x + t) € K. 


e) Une variété affine À est un sous-espace vectoriel de X si et seule- 
ment si OE À. 
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Exercice 1. Démontrer que toute variété affine s'obtient par transla- 
tion d’un sous-espace vectoriel. 


Définition 2. a) L'intersection de tous les ensembles con- 
vexes C qui contiennent l’ensemble donné M est appelée enveloppe 
convexe de l’ensemble M et notée conv MN: 


conv M— AN €, CES(M). (1) 
CM 


b) Si dans (1) on remplace les ensembles convexes par tous les 
cônes convexes À = M (les variétés affines À = M, les sous-espaces 
vectoriels Z = M), alors l’intersection s'appelle enveloppe conique 
(respectivement affine ou linéaire) de M, on la désigne par 
cone M (aff M, lin M). 

Définition 3. Soient x, ..., æ, des éléments de X. L'’élé- 
ment 


ñn 
L— à Mit; (2) 


est appelé combinaison linéaire, affine, conique ou convexe des élé- 
ments 21, ..., Zn Si dans (2) on a respectivement : 


pour la combinaison linéaire : les À; sont arbitraires, 


n 
pour la combinaison affine: > À,= 1, 
1 


pour la combinaison conique : À; > 0, 


n 
pour la combinaison convexe : 2 ki =1, À,2>0. 
1—= 


On démontre par récurrence que si les x,, . .., x, appartiennent 
à un ensemble convexe C (à un cône convexe Æ, à une variété affine À 
ou à un sous-espace vectoriel Z), alors leur combinaison convexe (co- 
nique, linéaire ou affine) appartient respectivement à C, K, À ou L. 

Proposition 2. a) l'enveloppe convexe (conique, affine ou 
linéaire) de l’ensemble M consiste de toutes les combinaisons convexes 
(coniques, affines ou linéaires) des éléments de M. 

b) L'ensemble M est convexe (est un cône convexe, une variété 
affine ou un sous-espace vectoriel) si et seulement s’il coïncide avec son 
enveloppe convexe (conique, affine ou linéaire). 

La démonstration sera effectuée pour un ensemble con- 


vexe M, les autres cas sont similaires. Désignons par M l’ensemble 


de toutes les combinaisons convexes des points de M. L'ensemble M 
est contenu dans M et il est convexe, puisque 
Mai 


Ma 
Ti = 2 Qyalits Lo—= à Œyolin A ZU, 
1= 1= 


pe 
> Gi = 1, T1, 2 


i={ 
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pour tout & € [0, 1] implique 
He Ms 
ati + (1— 0) TA, AU ;1T 4 + 2 (l—@) Girls 


et cette dernière somme est une combinaison convexe des points 


Lits + + +» mas Los + + + Tm,oe Par conséquent, conv M € M (car 
conv est l’intersection de tous les ensembles convexes contenant'W). 
D'autre part, comme nous l’avons remarqué plus haut, chaque point 


de M est contenu dans tout ensemble convexe qui contient M et 


donc M & conv M. 

Si M est convexe, on peut prendre C — M dans (1) et alors, évi- 
demment, conv M — M. Réciproquement, si conv M — M, M est 
convexe par définition de l’enveloppe convexe et en vertu de la pro- 
position 4 a). M 


Exercice 2. Démontrer que la somme arithmétique 


n 
Mit...+Mn={rl2e= da, EM, i=1,...,n) 


i=1 
d’un nombre fini d’ensembles convexes (de cônes, de variétés affines, de sous- 
espaces vectoriels) possède la même propriété. 


E x emples. 1) Les ensembles convexes non vides de la 
droite sont les ensembles constitués par un seul point et les interval- 
les de toutes sortes (intervalles fermés et ouverts, demi-intervalles, 
demi-droites ouvertes et fermées et la droite tout entière). 

2) Tout sous-espace vectoriel ou variété affine est un ensemble 
convexe. 


Exercice 3. Démontrer ces assertions. 


3) On appelle polyèdre convexe l'enveloppe convexe d’un nombre 
fini de points. Un cas particulier très important est le simplexe de 
dimension n, i.e. l'enveloppe convexe de n + 1 points affinement indé- 
pendants (aucun d'eux n’est une combinaison affine des autres). 


Exercice 4. Démontrer que l'enveloppe convexe de trois points de 
R? non situés sur une même droite (le simplexe de dimension 2) est le triangle 
à sommets en ces points. Qu'obtiendra-t-on si les points sont sur une même 
droite ? 


Dans un espace de dimension finie, on peut renforcer la propo- 
sition 2. Nous appellerons l’assertion correspondante théorème de 
Carathéodory quoique, strictement parlant, ce titre ne devrait se 
rapporter qu'à la partie où il s’agit de l’enveloppe convexe. 

Théorème de Carathéodory. Supposons que n — 
— dim (lin À) << ©. Chaque point qui appartient à l'enveloppe con- 
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vexe (conique, affine ou linéaire) de l’ensemble A est une combinaison 
convexe (conique, affine ou linéaire) d'au plus s points x,, ..., x, 
de À. 

Pour les enveloppes convexe et affine, s — n + 1, et les points 
Lys + - «+, &s peuvent être supposés affinement indépendants. 

Pour les enveloppes conique et linéaire, s = n, et les points x, . .. 

., Zs peuvent être supposés linéairement indépendants. 

Démonstration. A) Nous nous limiterons au cas le plus 
difficile de l’enveloppe convexe, pour indiquer ensuite quelles sont 
les modifications à introduire dans la démonstration des trois autres 
Cas. 

D'après la proposition 2 a), chaque x € conv À se met sous ja 
forme 


z=Mt +... + Apt, À > 0, 
k 
D A1, CEA (3) 


i=1 
(dans la définition de la combinaison convexe, on a À; > 0, mais 
il est clair que l’on peut omettre les À; = 0). 

Montrons que si les x,, ..., x, sont affinement dépendants, le 
nombre de points dans cette famille peut être rendu plus petit, tout 
en conservant une représentation de la forme (3). En effet, si les 
points æ1, ..., æ, Sont affinement dépendants, alors l’un d'eux 
est la combinaison affine des autres; sans perte de généralité on 
peut écrire 


Th —= Midi +... + Ur-1TRh 14; 2 D; = Le 


k k 
Posons encore u, = —1, on a > u;xz;—=0, >, py—0. Soit main- 
i=1 i=1 
tenant 
_ ke 
a= min { Tr ui <0}. 
Alors 


T — : À; Ta 2 > MAT 7 À Qi + api) x; — p: it, 
où tous les à sont non rie d’après le choix de & et au moins 
un d’entre eux est nul. Eliminant de la suite {trs ..., TR} CEUX 
des x; pour lesquels À; — 0, nous obtenons une Ter eRIEtION de la 


forme (3), avec un plus petit nombre de points ù À — > À; + 


k 
. a Du: = 1 
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Désignons maintenant par s (x) le plus petit nombre d'éléments 
de la suite {x,, . .., x,} pour lequel la représentation (3) est pos- 
sible (tout ensemble non vide d’entiers naturels possède un plus 
petit élément). Le raisonnement que nous venons d'effectuer montre 
que les points de la suite {x,, . .., æ.,(x)} doivent être affinement 
indépendants. Il ne reste qu’à remarquer que dans l’espace à n 
dimensions tout ensemble de n + 2 points {2, . .., æn+,} est af- 
finement dépendant. En effet, les points &; — tn+o, à = 1, ... 
..., n +1, doivent être linéairement dépendants et si l’on pose, 
par exemple 


n 
LTn+1— Tn+e F2, À; (x; ss Ln+2); 


on obtient 


Ln+1 = (1 ar À À) Tate + 2 hits. 


n ñn 
Puisque 1— D À,+ D À,—1, on voit que z,4, est une combi- 
i=1 i—1 


naison affine des autres points. 

B) Pour le cas de l'enveloppe affine, dans le raisonnement ci- 
dessus il faut omettre tout ce qui concerne les inégalités À; > 0, 
à; > 0 et on peut poser &« — —À;/u; pour tout à tel que u; Æ 0. 

Dans les deux autres cas, les combinaisons affines sont remplacées 
par des combinaisons linéaires et le nombre de points linéairement 
indépendants ne peut être supérieur à n. Pour l'enveloppe conique, 
on conserve le raisonnement avec les inégalités; pour l’enveloppe 
linéaire on peut l’omettre. : 

Passons à la description des fonctions convexes. Ici, comme dan 
la suite du présent paragraphe, nous entendrons par fonction toute 
application f: X —jR, où R = R U {—c, +} est la droite aug- 
mentée 1). 


1) Les opérations arithmétiques et les inégalités auxquelles participent 
les nombres impropres oc et —o se définissent de la manï‘ère suivante (ici 
a € R est quelconque et p > 0): 


Sr (oo) = +oo, (Ho) (Ho) = How, oo > 


+a—= Ho, (—c) (Ho) = Fo, —oc <a, 
(— co) + (— 00) — —o, (+oo)-:p — +oo, oo > —c, 
— (+00) — —00 (Ho) -0 = 0, 


—(—o) = +00, (Ho) (—p)= Fo; 


les expressions (+00) — (+0), (00) + (—oco), (—co) — (—c) sont décla- 
rées dénuées de sens; on ne définit pas non plus la division par les nombres 
impropres. 
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A chaque fonction on peut faire correspondre deux ensembles 
domf = {7€ X | f (x) << +00}, 
epif = {(x, EX XR]aZ>f(x), xE dom}, 


que l’on appelle respectivement ensemble dominé et épigraphe de 
la fonction f. 


Exercice 5. Démontrer que l’ensemble C € X X R est l'épigraphe 
d’une certaine fonction f: X — KR si et seulement si VYz, {a | («, x) € C} 


est @, R ou [a, oc), 1. 


Définition 4. La fonction f, pour laquelle dom j  @ 
et partout f (x) > —o, est dite propre, les autres fonctions sont 


appelées impropres. La fonction f: X — KR sur l’espace vectoriel X 
est dite convexe, si epi f est un ensemble convexe dans X X KR. L'’en- 
semble de toutes les fonctions convexes sur X est désigné par 7° (X). 
On déduit immédiatement de cette définition la 
Proposition 3. a) Pour qu'une fonction propre f soit con- 
vexe, il est nécessaire et suffisant que pour tous points x; € dom f et 
n 


tous les a; >0,i—1,...,n vérifiant >) «; — 1 on ait l'inégalité 
= 1 
de Jenssen 


70) a) Ÿ &ifi (Ti). (4) 


b) La somme 2 f; (x) d’un nombre fini et la borne supérieure 
=1 
Velo SUP PAC x)} d'une famille quelconque de fonctions con- 


vexes sont convees. 

Exemples. 1)Fonctions convexes sur la 
droite. Soit fo (x): (&, BP) — R, la dérivée f, (x) étant définie 
et non décroissante sur l’intervalle ouvert (œ, B) = R. Posons 

fo (x), x E (x, ), 

f (x) = 

+ oo, æxé(x, f). 
Pour cette fonction dom f = (a, B). Vérifions qu ‘elle est convexe. 
Un point quelconque du segment qui joint les points (x;, z;) € epi }, 
i — 1, 2, est de la forme (ax, + (1 — œ)x,, oz, + (1 — @) 2), 
a € [O, 11. Appliquons la formule de Lagrange 
QG, + (l — à) 22 — f (ax, + (1 — à) x) > 

> af (x) + (A — à) f (te) — f (ar + (1 — à) x2) — 
= af" (c1) (1 — (axs + (1 — à) x2)) + 


$ 2.6*] ÉLÉMENTS D'ANALYSE CONVEXE 207 


+ (— a) f" (C2) (te — (ar + (À — à) «2)) — 
= œ@ (1 — @) (f (c1) — Ÿ (ce)) (1 — 22) > 0, 


puisque x, < 0, ax + (1 — a) x, Le, Lx, et la dérivée est 
non décroissante par hypothèse. Par conséquent, (ax, + (1 — &) x, 
az, + (1 — a) z,) € epi f, et f est convexe. M 


Exercice 6. Supposons que la fonction convexe f: R — Rest finie 
sur l'intervalle ouvert I = («, B). Démontrer que j est continue sur J et possède 
en chaque point x € Z des dérivées à droite et à gauche f! (x), f! (x) qui sont 
non décroissantes sur Z et coïncident partout, sauf dans un ensemble de points 
au plus dénombrable. 


2) Supposons que sur l’ensemble ouvert convexe U de l’espace 
normé X la fonction f, est de classe C? (voir 2.2.5) et sa différentielle 
seconde d?f, = f, (x) LE, El est non négative. Comme dans l’exemple 
précédent, posons 


fo(x), xEU, 
j@=| oo, xéU. 


La restriction de cette fonction à toute droite de X possède les mêmes 
propriétés que les fonctions envisagées dans l'exemple précédent 
(démontrez-le !). Par conséquent, f est convexe (pour vérifier la con- 
vexité de epi f, il suffit de se limiter à toutes les sections de cet en- 
semble par des plans verticaux de dimension 2 dans XX R). 

Ces exemples nous donnent un grand nombre de fonctions con- 
vexes concrètes. Telles seront sur R les fonctions e*, ax? + bx + c 
pour a >0, —In x (prolongée par la valeur + pour x & 0), 
etc. Dans l’espace euclidien, la fonction quadratique f (x) — 
—= (4x | x) + (b | x) + c, où À est un opérateur symétrique défini 
positif, est convexe. 

3) {ndicatrice. C’est ainsi que l’on appelle la fonction 


oo, æxéÀ, 
0, x E À. 
Il est clair que 6A (x) € 7° (X) si et seulement si À € $ (X). 
4) Fonction de Minkowski (voir 2.1.3). 
L'inégalité de Jenssen (4) est la source de nombreuses inégalités 


que l’on emploie dans diverses branches des mathématiques. En 
particulier, si on l’applique (en posant «; — 1/n) aux fonctions 


—Inz, x>0, 
eee z<O, 
ælinz, x>0, 
f2 (&) = 0, z= 0, 


+ oo, æ<D0, 
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on obtient dans le premier cas l'inégalité bien connue de Cauchy 

entre la moyenne arithmétique et la moyenne géométrique, et dans 

le deuxième, l’inégalité sur l’entropie de la distribution (p,, . . ., Dh) 
ñn 


importante en théorie des probabilités, où p, = x; | > x;, x; > 0, 
i=1 


H(p}=— ZPimp<in. 


2.6.2. Ensembles et fonctions convexes dans les espaces vectoriels 
topologiques. Supposons maintenant que X est un espace vectoriel 
topologique localement convexe ([KF], chapitre IIT, $ 5). Il est 
bien connu que dans ce cas l’espace dual X*, qui consiste de toutes les 
fonctionnelles linéaires continues, est suffisamment riche (voir le 
même livre, chapitre IV, $$ 1-2), ce qui nous donne un grand 
nombre d’ensembles et de fonctions convexes. 

Les ensembles convexes les plus simples dans X sont les hyper- 
plans et les demi-espaces (ici x* € X*) 


H (x*, a)={x]|4{x*, x) =} hyperplan, 
H+(x*, a)={x|(x*, 2) <a} 
Ha", 0)={rl@", Du) 
H_ (a*, a)={x|(x", 2) <a} 
À _ (x*, a)={x|(x*, 2) > a} 


| demi-espaces fermés, 


| demi-espaces ouverts. 


Exercice 1. Vérifier que ces ensembles sont effectivement convexes. 


Ensuite, appelons polyèdre convexe l'intersection d’un nombre 
fini de demi-espaces fermés (notons que cette intersection n'est pas 
nécessairement un ensemble borné). 


Exercice 2. Démontrer que dans R' tout polyèdre convexe dans le 
sens de 2.6.1 est un polyèdre convexe dans le sens de la définition précédente 
et que chaque polyèdre convexe borné est un polyèdre convexe. 


Faisons maintenant une liste des propriétés topologiques des 
ensembles convexes qui nous sera nécessaire par la suite (pour les 
définitions des termes topologiques, voir [KF|]). 

Proposition 1. Soit À un ensemble convexe; alors: 

a) tous les points du demi-intervalle [x,, x,), où x, € int À, x € À, 
appartiennent à int À; 

b) l’intérieur int À et l'adhérence À de l’ensemble À sont convexes ; 
si int À = @, alors À = int À. 

Démonstration. a) Soit VŸ & À un voisinage convexe 
du point 2,. Un point arbitraire x € [x,, x,) est de la forme x — 
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= ax + (A — a) x, 0 La LA, et a V + (1 — &) x, est son voi- 
sinage contenu dans À, i.e. x € int À. 

Il découle de l’assertion a) que À Cint À, lorsque int À Æ @, 
d’où À &int À. L'inclusion inverse est évidente. 

b) Si x; € int À, i — 1, 2, alors, en vertu de a), on a [x,, x,] € 
€ int À, i.e. int À est convexe. Supposons maintenant que x; € À, 
i — 1, 2. Prenons un voisinage convexe quelconque du zéro de Y. 
Par définition de l’adhérence, on peut trouver des points x; € 
E (x; + V) NA, i = 1, 2. Pour tout point x = ax, + (1 — a)x, € 
Ex, xl, posons x = ax, + (1 — a) x,. Alors 2€ À et 2€ 
Ea(z, + V) + (1 — &) (xs + V) = x + V, ie. chaque voisinage 
du point x contient des points de À, d’où l’on tire x € À et le fait 
que À est convexe. M 

Définition 1. L'’intersection de tous les ensembles fermés 
convexes qui contiennent l’ensemble À est appelée adhérence convexe 
de l’ensemble À; on la note conv À. 

Il est clair que conv À est convexe et fermé. 


Proposition 2. a) conv À = À <> l’ensemble À est con- 
vexe et fermé; 








b) conv À coïncide avec l'intersection de tous les demi-espaces 
fermés qui contiennent À ; 

c) conv À — conv À. 

Démonstration. La première assertion découle immé- 


diatement de la définition. L’inclusion conv À & conv À est égale- 
ment évidente (un ensemble convexe quelconque contenant À n'est 


pas nécessairement fermé), et donc conv À € conv À. D'autre part, 
conv À, étant un ensemble convexe (proposition 1b)), fermé et 
contenant À, doit par définition contenir également conv À, de 
sorte que conv À = conv À. 

Désignons maintenant par B l'intersection de tous les demi- 
espaces fermés qui contiennent À. Alors conv À & B (un ensemble 
fermé convexe arbitraire contenant À n'est pas nécessairement un 
demi-espace). 














Supposons que le point x, n'appartient pas à conv À. D'après 
le deuxième théorème de séparabilité (voir 2.1.4), il existe une fonc- 


tionnelle linéaire x* € XŸ* qui sépare strictement x, et conv À 


{t*, %) > sup (x*, x) =. 
xEconv A 





On a donc x, H}4(x*, à) = conv AZ À et, par conséquent, x) B. 
Ainsi conv A—B. 


14—0237 
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Exercice 3. Dans l’espace hilbertien Z, envisageons l’ellipsoïde de 
dimension infinie 


B={r=(r, 24 ...)] S (zn/an) <1) 
n=! 


à demi-axes a). 
a) Démontrer que l’ensemble B est convexe et fermé. 
b) Trouver des conditions (imposées sur «a,) pour lesquelles int B Æ g. 
c) Supposons que int B & @, le point y = (y1, yo, . . .) étant situé sur 
O0 


{a frontière de l’ellipsoïde, i.e. > (Yn/a,)? = 1. Démontrer que l’on peut cons- 
n=1 
truire un hyperplan passant par y de manière que Z soit situé d’un seul de ses 


côtés. 
d) L’assertion précédente est-elle toujours vraie si int B = g? 

De même que les ensembles convexes les plus simples sont les 
demi-espaces, les fonctions convexes les plus simples sont les fonc- 


tions afjines 
a (x) = {x*, x) — b, 1x*EX, bER. 


Exercice 4. Démontrer que a (+) est convexe; trouver epi a. 


Les propositions 1 et 2 possèdent ici des variantes analogues. 
C’est à leur énoncé que nous passons. 

Définition 2. Soit f: X—+R. La fonction f définie par 
la condition epi f — epi f est appelée adhérence de la fonction f; 
si f — f on dit que la fonction est fermée. La fonction conv f définie 
par la condition epi (conv f) — conv (epi f) est appelée adhérence 
convexe de la fonction f. 


Exercice 5. Vérifier que epif et conv f sont les épigraphes de cer- 
taines fonctions (voir l'exercice 5 de 2.6.1). 


Il est clair que conv f — f <> f est convexe et fermée. 
Rappelons également qu’une fonction f: X — R est dite semi- 
continue inférieurement au point x si lim f (x) > f(x) et tout simple- 


XX, 
ment semi-continue inférieurement si cette inégalité est vérifiée pour 
tout x. | 

Exercice 6. Démontrer que f: X —+ R est semi-continue inférieure- 


ment si et seulement si, pour tout c€ R, l’ensemble Ze f — {x | f(x) < c} 
est fermé dans X. 


Proposition 3. a) Pour qu'une fonction propre soit fermée 
il faut et il suffit qu'elle soit semi-continue inférieurement. 

b) Pour qu'une fonction convexe f soit continue sur int dom f, 
il suffit que f soit bornée d’en haut dans un voisinage U d'un certain 


point x et finie au point z. 
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De plus f est propre, int dom f = @, 
intepif = {(x, EX X R]|xEiïintdomf, a —>f(x)}} = Q 


et 


f (x) = (conv ff) (x), Vzx E int dom f. 

D'après l’exercice 6, il faut vérifier que l’ensemble Z.f est fermé. 

Démonstration. A) Soit f une fonction fermée. Alors 
epi f est un ensemble fermé dans X X R. L'’hyperplan H — 
= {(x, a)| « = c} est également fermé. Par conséquent, il en est de 
même pour l’ensemble Z.f = {x |f(x) <c}, car epif NA H — 
— {(x, c) |x € L£.f} et l'application ær-- (x, c) est un homéomor- 
phisme. 

Supposons au contraire que tous les Z.f sont fermés et (x,, &o) € 
Cepif. Alors f (x) > &, et, par conséquent, f (xs) > &o + € pour 
un certain e > 0 et x Ë Late f. Puisque Zoref est fermé, il 
existe un voisinage V 3x, tel que V NN Lootef = D, i.e. f (x) >> 
> à, + &, x E V. L'ensemble ouvert {(x, a) [x E V, à << ay + €} 
contient (to, &o) et n’a pas de points communs avec epi f. Par consé- 
quent, le complément de epi f est ouvert, tandis que l’ensemble 
epi f lui-même est fermé. 

B) Lemme. Soient X un espace localement convexe, V un 
voisinage convexe du point x dans X, f une fonction convexe sur X 
qui prend au point x € V une valeur finie (f (x) == —) étant bornée 
d'en haut dans V. Alors f est continue au point x. 

Démonstration du lemme. En effectuant la trans- 
lation x > x + xet en soustrayant la constante f (x) de f, nous pou- 
vons réduire le lemme au cas où æ—0,0€V, f (0) = 0, 


sup f(x) LC. Alors V peut être considéré comme étant un 
xEV 


voisinage symétrique de zéro (autrement nous aurions considéré 


W = V N(—V)). Supposons que 0 << & << 1 et x E a V. Alors x/a € 
€ V et, jf étant convexe, nous avons 


f (x) = f (1 — à) 0 + ala) & (1 — a) f(0)+af(x/a) & ac. 
D'autre part, —zx/a € V, vu la symétrie de V, et en utilisant l'égalité 
0 = x/(1 + a)+aæ/(1 + a) (—x/a) et la convexité de f, nous obtenons 
0 = ÿ (0) = f (x/(Ü + à) + &/(A + à) (—x/a)) K 

1/1 + à) f (x) + &/( + à) f (—zx/a), 
donc f (x) > —af (—x/a) > —acC. 


Ainsi, si æ € aV, alors | f (x) | a, ï.e. f est continue au point 
zéro. D 

Corollaire. Dans les hypothèses du lemme, int dom f = @. 

C) Revenons à la démonstration de la partie b) de la proposi- 
tion 3. En vertu du lemme et de son corollaire, f est continue dans x 
et int dom f Æ G. 


14% 
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Supposons que f (y) — —o en un certain point y, i.e. pour tout 
a € KR le point (y, «) appartient à epi f. Puisque epi f est convexe, 
on à 


(—A)z+ ay, (1 — A) f(x) + ha) € epi f, 


pour tout œ ER, d'où l'on tire f ((1 — À) x + Ày) — —oo, ce qui 
est en contradiction avec la continuité de f en x si l’on prend À | 0. 
Ainsi f (y) >> — partout, i.e. f est propre. 

Supposons maintenant que y E int domf. Trouvons un p > 1 
de manière à avoir z = x + o (y — x) € int dom f (ce qui est pos- 
sible, car l'intersection de l’ouvert int dom f avec la droite qui passe 
par x et y est un intervalle ouvert de cette droite). L’homothétie 
G de centre z et de rapport (p — 1)/p transforme x dans yet le voisi- 
nage V dans un voisinage V”’ du point y. Alors, si 6 € G (V) — 
on a G— (op — 1)/ox + 2/0, x E V et 


OS + TASER C + (0, 


par conséquent f est continue au point y d’ . le lemme, i.e. f 


est continue sur int dom f. 
Si (to, &o) E int epi f, alors, par définition, on peut trouver un 


voisinage W du point x, et un nombre € >> 0 tels que 
{(x, a) [re W, [a — a |<e} Cepif, 


d'où +, € int domf et «y —f(xo). L'inclusion inverse 
{(x, &) [x Eint domf, « > f(x)} int epi f 


est évidente; en particulier int epi f Æ @. 
Puisque f est convexe, conv (epi f) — epi f. En se rappelant la 
définition 2 et la proposition 2 c), on peut écrire 


epi (conv f) — conv (epi f) — conv (epi f) = epi (f) = epi (f). 


Par conséquent, on a toujours (conv f) (x) < f (x). Si f est continue 
au point æ (ou au moins semi-continue inférieurement), tandis que 
f (x) > «, on a cette même inégalité dans tout un voisinage du point 
z, de sorte que (x, a) é epi f = epi (conv f) et (conv f) (x) > «. 
Par conséquent, (conv f) (x) = f (x). En particulier, dans les hypo- 
thèses de la partie b) de l’assertion que nous démontrons, cette égalité 
est valable pour tout x E int (dom). M 


Exercice 7. Supposons que f est convexe sur X et f(x) = —o en 
un certain point x € int domf. Alors f (x) = —oc, VYx € int dom f. 
Définition 3. La fonction affine a (x) — (2*, x) — best 


appelée fonction d'appui pour la fonction f si 
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a) a (x)< f(x) pour tous les x; 
b) pour tout & >> 0, il existe un x tel que a (x) > f (x) — &. 
Autrement dit, 


b= sup{(a*, 2)— f (a)}. (1) 


Théorème de Minkowski. Une fonction propre f est 
convexe et fermée si et seulement si elle est la borne supérieure de l’en- 
semble de toutes ses fonctions d'appui affines. 

Démonstration. 1) «Si». Une fonction affine est tou- 
jours convexe et fermée puisque son épigraphe est un demi-espace 
fermé. En outre, pour toute famille de fonctions {f,}, on a 


epi {sup f.}={(, 2) 1 22æsup fa ()}= 
QUE N{(;, 2)|2> fa @y=N pi fa (2) 


et si tous les f, sont convexes et fermées, alors les epi f, sont des 
ensembles convexes fermés dont l’intersection a la même propriété. 

2)4«Seulement si». Par hypothèse, B = epif est un 
ensemble fermé convexe non vide dans X X R. Conformément à la 
proposition 2, B est l'intersection de tous les demi-espaces fermés 
qui le contiennent. Toute fonctionnelle linéaire continue sur 
X X R étant de la forme (x*, x) + Az, a* EX*, ÀER (voir 
2.1.2), le demi-espace fermé est défini par l'inégalité 


a, æ) +2 < b. (3) 


Puisque B — epi f est non vide et contient avec chacun de ses points 
(Zo, Z0) tous les points (x,, 2), z > Z,, B peut être contenu dans Île 
demi-espace (3) seulement si À < 0. Pour À — 0, le demi-espace (3) 
sera dit vertical. Il est évident que 
epif = {(x, 2) | f (x) L2} Ca, 2) | GG, 2) Kb} 
< domf Cfx | (2*, à) << b} = H4 (x*, b) = 
+ epif CH}(:*, bd) X RK. 


Pour À << 0, tous les termes de l’inégalité (3) peuvent être divisés 
par | À |, de sorte que l’on peut supposer que À — —1 et que le demi- 
espace (3) coïncide avec l’épigraphe de la fonction affine a (x) — 
= (x*, x) — b. Mais 


B =epif Cepa f(x) ax), Vrx. 
Donc 
pif=Nepian NM, (AG, BXRL (4 


dom fCH+(x*, b) 


Remarquons maintenant qu’au moins une fonction affine a) < f 
existe (dans le cas contraire epi f contiendrait avec chaque point 
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(to, Zo) tous les points (x,, z), z ER, d’où f (x,) — —o, quoique 
f est propre). Mais 


epi tof 4 (2, D) XR—{(zx, 2) | a (x) 2, (x*, 2) Kb} — 
N,{@ 2) ) | ao (x) HA, x) — db) <Lz}— 


— N epi{as(x)+À((x*, x) —b)}, 
À1>0 


et si a) (x) f(x) et dom f CH; (x*, b), on a 
f(x) << +oo = (2%, x) — bDLO— a (x) + A (Ë, x) — b) L 

< f (x). 
Par conséquent, epi 4, N[Æ;(1*, b)XR]= fN epia, de sorte que 

af 
l’on peut se débarrasser de tous les demi-espaces verticaux 
I} (x*, b) X R dans (4). Ainsi 
epi f= f) epia, 
a<f 


et, d’après (2), 
f (x) = sup {a (x) |a (x) est affine et <f (x)}. (5) 


Il reste à remarquer que l’on peut se limiter dans (5) aux fonctions 
d'appui pour f, puisque la borne supérieure ne changera pas si, parmi 
toutes les fonctions a (x) — ({x*, x) — b << f (x) (avec le même r*), 
on choisit celle pour laquelle b est déterminée par l'égalité (1), 
i.e. la fonction d’appui. M 


Exercice 8. Sif: X—+ HR est convexe et fermée et f (x) — —o, 
alors f (x) = —c, x € dom f. 


Pour les fonctions différentiables, nous pouvons nous servir de 
l’assertion suivante. 

Proposition 4. Si la fonction f est convexe et différentiable 
selon Gâteaux au point x,, alors la fonction a (x) = {fG (Zo)s T — To) + 
+ f (to) est sa fonction d'appui. 

Démonstration. La condition b) de la définition 3 dé- 
coule de l'égalité a (x,) = f (x). Supposons que f (x) < a (x;) pour 
un certain x,. Alors f(x)<a(x;) —#e pour un certain & > 0 
et donc, pour 0<a<i, on a 


Î (Go + à (21 — o)) = f (À — à) ro + au) K 
< (1 — à) f (to) + af (xs) < (1 — à) f (ro) + à (a (1) — €) — 
= ({ — a)f (xs) + à (f (to) + (fe (to); T1 — Lo) — €) = 
= f (to) + à (fG (to) L1 — Lo) — GE. 
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Par conséquent, 


(fe (ru), aa ag) = Lim LEE EE (fé (ag), a — a) — 8, 
œ 

ce qui est une contradiction. Nous avons donc également la condi- 

tion a). 


Supposons maintenant que la fonction f: X — Rest différentiable 
selon Gâteaux en chaque point x, € X. Constituons sa fonction de 
Weierstrass (cf. 1.4.4): 


E (Los 2) = f (x) — f (to) — (Fe (Lo) ET — Lo). 


Proposition os. Pour que f soit convexe, il est nécessaire et 
suffisant d'avoir l'inégalité £(xo, x) > 0, Vzx, x. 

Démonstration. a) Si f est convexe, alors € (x,, x) > 
> 0, Vz x,, d’après la proposition 4 que nous venons de démontrer. 

b) Soit x, = ax, + (1—a)x:, 0OLa<LA. Les inégalités 
E (to 21) > 0, 6 (to, 22) > 0 signifient que les points (x,, f (xi)), 
(x: f (x2)) sont situés dans les demi-espaces {(x, 2) | 2 > f (xo) + 
+, {à (to), x — x0)}. Par conséquent, le segment qui les joint 
es t situé dans ce même demi-espace, de sorte que 


Qf (21) + (1 — à) f (x2) > 
> Î (to) + (Go), At + ( — à) ze — Zo) = f (ro). M 
Ainsi les conditions de Weierstrass de 1.4.4 vérifiées pour tous 
les points (ire: 2) sont équivalentes à la convexité du lagrangien 


L (#, x, 2) relativement à x. 


2.6.3. Transformation de Legendre-Young-Fenchel. Théorème de 
Fenchel-Moreau. Supposons toujours que X est un espace vectoriel 
topologique localement convexe et X* est l’espace dual. Choisissons 
maintenant une fonction arbitraire f: X — KR et étudions plus en 
détail l’ensemble de ses fonctions d'appui. Il est alors naturel de 
supposer que la fonction f est propre, puisque, en vertu de la défini- 
tion, f (x)> à (x) > — partout où f possède au moins une fonction 
d'appui, tandis que le cas f (x) = + est trivial: toute fonction 
affine est une fonction d'appui. 

Définition. La fonction sur X* définie par l'égalité 


f* (p)= sup {(p, x) —j (x)} (1) 
xEX 


est dite fonction adjointe à f ou transformée de Young-Fenchel de f (ou 
parfois transformée de Legendre de f), tandis que la fonction 


F*(æ)= sup {(p, x) — f* (p)} (2) 
pEX * 


est la deuxième fonction adjointe de f. 
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Il découle de l’égalité (1) de 2.6.2 que l’ensemble des fonctions 
d'appui pour f est en bijection avec l’ensemble de tous les p € X* 
pour lesquels f* (p) est finie: 


(p, f* (p) Æ Ho) + ab (x) = (p, x) — f* (p). (3) 


Remarque. Malgré la symétrie apparente des formules (1) 
et (2), f** =£ (f*)*. C’est que (f*)*, par définition, doit être envisagée 
sur (X*)*, et non sur X. Ce n’est que sur les espaces réflexifs que l’on 
peut identifier (f*)* et f** de manière naturelle. 

Proposition 1. 1) Les fonctions f* et f** sont convexes 
et fermées. 

2) Pour tous xE X et pE X* on a l'inégalité de Young: 


f (x) + ff E) > (p, x). (&) 


” FE* (x) K f (à), Vz. 

4) Si f(x) Lg (x), alors f* (p) > g* (p) et ** (x) K g** (x). 

Dos on 1) On voit à partir de (1) et (2) que 
les deux fonctions s’obtiennent comme bornes supérieures d’un cer- 
tain ensemble de fonctions affines, de sorte que leurs épigraphes 
sont (en vertu de la formule (2) de 2.6.2) l'intersection de demi-espaces 
fermés ; ils sont donc convexes et fermés. 

2) II découle de (1) que pour tous x € X et p € X* on doit avoir 
f* (p) > (p, x) — f(x), ce qui est équivalent à (4). 

3) D’après ce que nous avons déjà démontré, f (x) > (p, x) — 
nu f* (D); d'où 

j GISÈR (P, 2) —f" (p)}= (à). 


4) C'est une conséquence évidente des définitions. M 

Exemples. 1) Soit f (x) — (x, x) — b une fonction affine. 
Une telle fonction ne possède qu’une "seule fonction d’ appui : elle- 
même. Par conséquent 


+ oo, pÆx, 
f* (p)= sup {(p, x) —(x0; 2+0=| b : : (5) 
x 9 P = To; 
et 
ie MIT {(p, x)— f* (p}} = (26, 2) —b= f (x). (6) 


2) Supposons que, de même que dans l'exemple 1 de 2.6.1, 
fo (x), a Lx <$, 
Ï (@) = 
+ oo, æxé(x, f), 
la fonction f, (x) étant continue et croissante sur (æ, fi). Posons 


— lim f(x), B=— lim f(x). 
x+a+0 x—-p-0 
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Pour tout p € (4, B) l'égalité p = f, (x) est vérifiée pour un cer- 
tain x, E («, B). Puisque f (x) est une fonction convexe, on voit. 
que (proposition 4 de 2.6.2) 
a (x) = f (to) + (to) (& — Zo) = PT — (PXo — f (to) 

est une fonction d'appui et donc les égalités 

f* (D) = Pto — fo (Xo)» P — fo (to) (7) 
définissent f* (p) paramétriquement dans (4, B) (la fonction f* 
définie par les égalités (7) est appelée transformée de Legendre de la 
fonction f, en analyse classique). 


Exercices. 
1. Que peut-on dire dans cet exemple au sujet de f* (p) lorsque p € (4, B) ‘4 
2. Pour les fonctions f sur R suivantes, Et dom f, epi j; vérifier si 


elles sont convexes et fermées; calculer f* et f** 


a) at?+ürte, a>0, eat 
o) lzl—11, d) 6fa, F(={ D FER SE 
À Pl EH den 
+ 00, Iz1>1, let, 
x > 0, 
g) er, RER 
LL Re . z > 0, 
0, :=0, M 
Lo, zx<0, Li 
xa xa 
o [+ 2e Ge) D Da et), 
oo, z<0 0, x <0 


m) |[æx{a/a (a 21). 
3) L'exemple suivant nous servira par la suite dans le $ 3.5. 
Proposition 2. Supposons que la fonction f: R° — KR est 
définie par l'égalité f (x) = f (x, . . ., x) = max {x,, . .., ts}. 
A lors 
S 
0 si p;>0, } pi=1, 
11 


+ oo dans les autres cas. 


f* (p)=f* (Pas... ps) = 


Démonstration. Puisque f est le maximum d’un nombre 
fini de fonctions linéaires (donc convexes et continues), sa convexité 
et sa continuité sont évidentes. 


Si p;,>0, >, p;=1, on a (p, x) max {z,...,x}, et par 
1 
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Jà même 
f* (Du {(p, t)— max {xy, ..., ah} = 0. 


D'autre part, si f* (bp)  +o, on a nécessairement f* (p) = O0, 
puisque les fonctions x (p, x) et ti max {x,, ..., x} sont 
homogènes, i.e. pour ces p on a l'inégalité 


2 Pit; — max {24, ..., 2} KO, Vr. 
i=1 


En substituant x; = 0, j Æi, x; — &, dans cette inégalité, on 
obtient p,ë < max {Ë, O0}, d’où p; > 0. En posant x; = a, i — 
= 1, ...,s, dans cette même inégalité, on obtient 


a > p;<a, VatR D p,=1. 
i=1 i=1 


4 Fonction adjointe à la norme dans un 
espace normé. 

Proposition 3. Soit X un espace normé et N (x) = ||x ||. 
Alors N* coïncide avec l’indicatrice ÔB* de la boule unité de l’espace 
dual X*, tandis que N** (x) = N (x). 

Démonstration. Si [p|[|>1, on a (p, x) >||x || 
pour un certain x,, et donc 


(is (P}=eub {(P; a) — | 1} Zæsup {(p, atp)—a||t ||} = +00. 


Mais si [| p||&1, alors (p, 2) <{||x|] et 
f* (p) = sup ({p, æ)—[|x{|) = 0. 


En outre 
J** (x) = sup {{p, x) — f* (p)} = sup {{p,x)}} = [1x || = N(x). M 
ip Hpi<1 


9) Soit X — KR, f (x) — 1/(1 + 2°). Alors, comme on voit faci- 
lement, 


. = | 0, p—0, 
PEL, p#0, 


de sorte que l'égalité f** (x) = f (x) que nous avons observée dans 
les exemples 1) et 4) n’est pas satisfaite ici. 
Le théorème suivant, des plus importants en analyse convexe, 
montre que la coïncidence de f et f** est loin d’être un fait du hasard. 
Théorèmede Fenchel-Moreau. Soit X un espace 
vectoriel topologique localement convexe et j: À — R une fonction 
partout supérieure à —oo. Alors 


J** (x) = 0, 
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a) f** (x) = f (x) si et seulement si f est convexe et fermée. 

b) f** (x) = sup {a (x) | a (x) est affine et < f (x)}. 

c) S'il existe au moins une fonction affine a (x) <L f (x) (condi- 
tions équivalentes f* (p) Æ +oo ou f** (x) > —o partout), alors 
f**% (x) est la plus grande des fonctions convexes fermées non supérieures 


à f(x), ie. f** = conv f. 

NES ES à 

Démonstration. A) « Seulement si » découle de 1) de la 
proposition 1. Supposons maintenant que a (x) < f (x) est une fonc- 
tion affine. Dans l’exemple 1) nous avons établi que a** (x) = a (x). 
En nous servant à nouveau de la proposition 1, nous obtenons 


a (x) = a** (x) LFF (x) K J (x), 
et donc 


sup {a (x) | a (x) est affine et <f(x)} Lf** (x) L'f (x). (8) 


D'où résulte tout d’abord le « si » de a) car dans le cas où f est con- 
vexe et fermée, les deux membres de (8) coïncident (pour f propre: 
d’après le théorème de Minkowski, et dans le cas de f = <+oo, le 
premier membre est aussi égal à <oo). Aïnsi a) est démontré. 

B) Pour une fonction f arbitraire, trois cas sont possibles. S'il 
n'existe pas de fonction affine a (x) f (x), alors f*(p) — sup { (p, x) — 


X 
— f (x)} = +o pour tous les p et donc f** (x) — —oo. Mais dans 
ce cas, le premier membre de (8) est aussi égal à —o (sup @ —= —oo 
par définition), i.e. b) est vérifié. 

Si une fonction affine a (x) < f (x) existe, alors il découle de (8) 
que f** (x) > —o partout. Il reste deux possibilités. Si f** (x) = 
= oo, alors f (x) = + et les deux fonctions sont égales au pre- 
mier membre de (8), puisque la fonction affine peut ici être arbi- 
traire. Dans le cas où f** est propre on a, d’après le théorème de 
Minkowski, 


f** (x) = sup {a (x) | a (x) est une fonction d’appui pour f** (x)}. 
En comparant avec (8) nous trouvons que 
sup{a (x) |a(x) est affine et <f(x)} <f** (x) — 
— sup{a (x) |a(x) est une fonction d’appui pour f**(x)}}< 
<sup{a(x) |a(x) est affine et <f(x)}. 


Ainsi dans ces cas b) est également vérifié. 
C) Supposons maintenant qu'il existe une fonction affine a (x) < 
+. (x) et g (x) < f (x) est une fonction convexe fermée arbitraire. 
osons 


h (x) = sup {g (x), f** (x)}. 
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Cette fonction est fermée, convexe et on a partout f (x) > hk (x) > 
> —c. Par conséquent, 


h (x) = RE (x) LFFF (x) LA (à), 


donc h (x) = f** (x) et g (x) L'f** (x), ce qui démontre c). 

D) Puisque f** (x) f(x), on à (f**)* (p) > f* (p). D'autre 
part, d’après l’inégalité de Young f (x) > a (x) — {p, x) — f* (p), 
d’où l’on tire pour f* (p) finie en vertu de (8): 


JFG) za) et (F$)* GE) = 
me: (GP, 2) — FFT (x) < ul ({p, x) — a (x)) = f* (p). 


Le cas f* (p) = + est trivial et, pour f* (p) — —, nous obtenons 
f(x) =) =+o et (f**)* (p) = —co = f*(p). M 


Exercice 3. Supposons que f est convexe et bornée d'en haut dans un 
voisinage d’un certain point. Alors f** (x) = f (x), zx € int dom f. 


2.6.4. Subdifférentielle. Théorème de Moreau-Rockafellar. Théo- 
rème de Doubovitski-Milioutine. Soit X un espace vectoriel topolo- 
gique localement convexe et f une fonction sur X, f: À + RK. 

Définition. On appelle subdifférentielle de f au point x, 
le sous-ensemble de X* constitué de tous les éléments x* € X* 
pour lesquels on a l'inégalité 


fa) —f() > (a, z— x), VreEX. (1) 


On désigne la subdifférentielle de la fonction f au point x, par ôf (x). 
Ainsi Ôf (xs) est l’ensemble des « coefficients angulaires » des 
fonctions affines a (x) — (x*, x) — b qui sont des fonctions d'appui 
de f au point x,, i.e. sont telles que la borne supérieure dans la for- 

mule (1) de 2.6.2 est atteinte au point x,: 
D = (x, to) — f (to). (2) 

Proposition 1. La subdifférentielle Of (x,) est un ensemble 
convexe (éventuellement vide) de X*. 

Démonstration. Soit x* E df (xo), i = 1, 2, alors, par 
définition, f(x) — f (to) > (f, tæ—xo), f(x) — f (to) > (to 
z — tp). En multipliant la première inégalité par & et la deuxième 
par (4 — &), où &œ € I[0, 1], et en prenant la somme, on obtient 


f (x) — f (ro) > (or + ( — à) xr, x — x), Vr. 
Exemples. 1)Subdifférentielles de cer- 


tainesfonctionssurladroiteetsurle plan. 
Nous laissons au lecteur le soin de vérifier que 


— 41,11, = (0, 
a) fi) = |; ER) 0h (= | 220. 
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b) f2 (x) =V a+ + ZT; ot 


0 f2 T) — T T4 Lo 


C) fa(z)=max([ul, [m|), (ER) = 
{ GWIIy1+1y1<1}, x=0, 
(sign 21, 0), [ml], 
(O, Sign Lo), [> ]x: |, 
conv ((sign x4, 0), (0, sign 22)), |[æ11[—|2|—2, 20. 


+ 0 fa (x) — 


2) Subdifférentielle de la norme dans un 
espace normé. 

Proposition 2. Soient X un espace normé, X* l’espace dual, 
N (x) = ||zx ||. Alors 


ON (x) — B*, où B* est la boule unité dans l’espace dual si x=0, 
Le *EX* | = 1, (a, 2) = xl} si x 0. 


Démonstration. Comme nous l’avons vu auparavant 
(relation (3) de 2.6.3), l’ensemble des fonctions d’appui de j se trouve 
en bijection avec l’ensemble {r* € X*, f* (x*) 2 Ho} et l’on a 


Que (tr) = (T$, x) —f# (x*). 


D'après la proposition 2 de 2.6.3, 


0, *[<1, 
N* (x*) = ÔB* e)=t a 

+oo, a 1, 
de façon que les fonctions (x*, x), [| x* [| 1 sont des fonctions 
d'appui pour V. L'égalité (2) se transforme en 


O0 = (2*, zo) — [to ||, (3) 


de sorte que toute fonction x —+ (x*, x), [| x* || 1 est une fonc- 
tion d'appui pour À au point x, — 0 et 8N (0) — B*. Dans le cas où 
Zo = 0, l’ensemble x* € BY des points vérifiant (3) coïncide avec 
celui qui est indiqué dans l’énoncé. M 

Dans les exemples envisagés ci-dessus, la subdifférentielle existait 
en chaque point. Il va de soi que pour les fonctions non convexes 
(par exemple pour —|x |) elle peut n’exister en aucun point. 
Toutefois, les fonctions convexes, elles aussi, peuvent ne pas posséder 
de subdifférentielles, même dans les points du domaine effectif. 

Voici l’exemple le plus simple: 


= —V 1x, |z|<i, 
+ co, FAP 
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Aux points x, = +1 et x, — —1, la subdifférentielle est vide. 
Une condition suffisante pour l'existence de la subdifférentielle sera 
obtenue plus loin (voir le corollaire du théorème de Moreau-Rockafel- 
lar). 

Le théorème suivant en analyse convexe joue le rôle analogue à ce- 
lui joué en analyse classique par la propriété de linéarité d’une dif- 
férentielle. 

Théorème de Moreau-Rockafellar. Soient f;, 
i — 1, ..., n, des fonctions propres convexes sur X. Alors 


0(2h) 2 2 ôfi(). (4) 


Sien un certain point x toutes les fonctions, sauf peut-être une seule, 


sont continues et cette dernière est finie au point x, alors on a l'égalité 
suivante en tout point x 


o(2 1) (@ = Ÿ 0: (0. 6) 


Démonstration. Limitons-nous à n — 2; le cas d’un 
plus grand nombre de termes se démontre facilement par récurrence. 
L’inclusion df, (x) + ôf, (x) € d(f, + f2) (x) découle immédiatement. 
de la définition de la subdifférentielle. 

Soit 15 € 0 (f1 + fo) (to). Sans perte de généralité, on peut sup- 
poser que zo = 0,25 = 0, f;(0) = 0, i — 1,2. En effet, si ces rela- 
tions ne sont pas satisfaites, alors, à la place de f, et f,, on peut consi- 
dérer les fonctions 


Si (t) = fi (Go + &) — f1 (to) — (to, LT), 
go (x) = fa (xo + Z) — fe (to). 

Ainsi, supposons que 0 € 4 (f, + f,) (0). D’après (1), cela signifie que 
mn (1 (x) + fa (x) = f1 (0) + f2 (0) = 0. 


Soit x le point où jf, est continue et f, finie. Considérons deux ensem- 
bles convexes 


Ci = {@, a) |ax>f1(x), x E int dom f,} = int epi f:, 
Ca = {(@, a) l—a> fs (x)}. 
Il est clair que les ensembles C; et C, sont convexes, non vides 


((x, — fa (x)) E C2, C est ouvert et différent de @ d’après la 


proposition 3 b) de (2.6.2): la fonction f,, continue au point x, doit 
être bornée dans un voisinage de ce point) et €, NC, = @. En effet, 
Si (@, 21) € Ci N Co, on à fi (ti) La L —f2 (x), je. 


0 — Cn (f1 (x) + fa (2) K fi (m1) + fa (1) < 0, 
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ce qui est impossible. D’après le premier théorème de séparabilité 
(voir 2.1.4), C, peut être séparé de C, par une fonctionnelle linéaire 
non nulle (x*, f): 

inf ({x?, Nr sup ((t7, t) + fa). (6} 

(x, &)EC: (x, &)EC1 
Il est clair que 6 < 0, car autrement la borne supérieure serait égale 
à oo. Si l’on suppose que f = 0, on obtient 
sup (x, a) inf (x’, x). 
xEint dom fi xEdom f: 
Mais le maximum d’une fonction linéaire ne peut être atteint en um 
point intérieur, donc 
Give Sun GDS ni, oein). 


xeint dom fi xEdom fe 


Cette contradiction montre que f -£ 0. Par conséquent, on peut 


diviser tous les termes de (6) par | 6 |, alors, en désignant g* 
= | |-l1* et en nous servant du fait que epi f, & int epi f, — 
(proposition 1, 2.6.2), nous obtenons 


1 | 


sup{(rŸ,z)—fi(x)}= sup {(Ÿ, 2) —a}=— 
é re 


= sup {@,2—0}<, inf {@f, a) 
x, &)EC1 x, «)EC: 


= inf {(aŸ, 2) + fo (x)}. 


Pour x = 0, les valeurs de la fonction entre accolades coïncident. 
et sont nulles (f, (0) — f, (0) — 0). Par conséquent, 


fa) — fa (OZ, 2), fa() —f2(0)>(—2*, à), 


1.e. 
2* C0f1(0), —2* € 0f2 (0) 
et 
0 € 0f, (0) + 0, (0). 
Corollaire 1. Soit f une fonction convexe continue au point x. 
À lors 0f (xo) Æ © 
Démonstration. Considérons la fonction 


Î (Zo); T — To) 


+842) {0 2%. 
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Les fonctions f et Ô {x,} vérilient les hypothèses du théorème de 
Moreau-Rockafellar. L'égalité 

= 0 (f + 8 {xo}) (to) = 0f (to) + 08 {ro} (ro) = 0f (to) + X* 
signifie que 0f (x) = ©. 

En fait, la subdifférentielle 0f (x,) d’une fonction convexe conti- 
nue au point x, est un ensemble convexe compact dans la topologie 
*«-faible. 

Soit À un cône (voir 2.6.1). Le cône K* constitué de tous les 
éléments z* vérifiant (x*, x) > 0, Vxz E K, est appelé cône dual 
de K. Si0€EK, il découle immédiatement de la définition (1) que 
l'on a l'égalité 0ÔK (0) = —K*. 

Corollaire 2. Soient K,,..., K, des cônes ouverts convexes 
à intersection non vide. Alors 


( N K;)* — D KŸ. 
i=1 i—=1 


En effet, ajoutons à Æ; l’origine des coordonnées et envisageons 
les fonctions ÔX;. En leur appliquant le théorème de Moreau-Rocka- 


fellar (au point x en K;, différent de zéro, toutes les ÔK; sont 


12—= 
continues), nous obtenons 


\ Æi)* = — 08 (N K) (= —0(À 6K;) (0) — 


Ai! 


= — D) 08K;,(0) = >, Ki. 


Corollaire 3 Théorème de Doubovitski. 
Milioutine sur l'intersection des cônes- 
Pour que les cônes convexes K,,..., K,, Kh+,, parmi lesquels lesn > 1 
premiers sont ouverts et non vides, ne se CORRE pas, il est nécessaire 


et suffisant qu’il existe des fonctionnelles x € KŸ, i = 1, ..., n + 1, 
n+1 


qui ne s'annulent pas simultanément et telles que 2 ai = (0. 
Démonstration. tés pente de corére. 
lité, on peut supposer que À — n K;  @. Alors Æ est un cône ouvert 


qui ne se coupe pas avec a par hypothèse. D’après le premier 
théorème de séparabilité, on peut séparer X et K,+, par une fonc- 
tionnelle linéaire non nulle y* € X*: 
ue (y*, x) >> sup (y*, x). 
xEKn+1 
La dernière relation us que y* € K*Y et, puisque (—1) y* € Kñr1 
{le point x — 0 est un point limite aussi bien pour À que pour X,+1), 
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on peut, en se servant du corollaire 2, décomposer y* en une somme 
n 
% # # . ; 
y° = 2 Ti, LEKE, 1<Ki<n; 
îi— 


désignant (—1) y* par 24,1, on obtient alors ce qu'il fallait. 
Suffisance. Supposons que les x € K° ne s’annulent pas 
n+1 
simultanément et 2 x — 0. Soit 
i— 


n+1 
x € n K;, x Æ0, et ri, 0, 1<i<n. 
i—1 


Alors x€ int K;,={(2#%,, x) >> 0 et donc 0=<YS TŸ, x) > 0. Cette 
contradiction démontre le théorème. 

Théorème de Doubovitski-Milioutine sur 
la subdifférentielle d’un maximum. Soient 


f15 + «+, fn des fonctions convexes sur un espace topologique localement 
convexe X, continues au point 0; f (x) = max {f1 (x), . . ., fn (x)}; 
TI = {i,, ...,i,} une famille d'indices tels que 


= f (Xo) pour CT, 
Î: (Go) << f(x) pour if I. 
Alors 


0f (%0) = conv {0fà (to) U + - : U dfis (xo)} = 
=fatiate J'hsk, dEôfi (ro), M>0 Zu} 
Démonstration. A) Si 1E€1 et 2x*€0f; (x), alors 


f(x) — f (to) = f (&) — fi (to) > fi (x) — à (%0o) > 


>(2*, z— 20) = 2* € 0f (xo) + 0f (to) > Ù 0f; (Xo) = 
+ of (0) > conv {U 0h (rh 


la dernière implication étant une conséquence de la convexité de 
0f (xs) (proposition 1). 

L'inclusion inverse sera démontrée par récurrence sur le nombre 
des fonctions. Pour nr — 1, l’assertion est évidente; par la suite 
nous supposerons que pour n — { fonctions elle est satisfaite. 

B) Lemme. Si la fonction f (x) est convexe et l'inégalité 


px) = f (à) — f (to) — GŸ, à — &o) > 0 (7) 


est vérifiée dans un certain ensemble ouvert convexe V et l’on a @ (x) = 0 
pour un certain point x € V, alors x* € ôf (to). 
15—0237 
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Démonstration. Montrons que l'inégalité (7) est satis- 
faite pour tous les x; l’assertion du lemme en découle d’après la défi- 
nition de la subdifférentielle. 


Supposons que x est arbitraire. La fonction @ est convexe en 
même temps que f et, si (x) <T 0, on a pour tout & € (0, 1) 


p((l— a) x + ax) L(1— a) p (x) +ap (x) = ap (2) < 0. 


Pour « suffisamment petit, le point (1 — &) x + ar appartient à V, 
et nous avons abouti à une contradiction. Ainsi @ (x) > 0 pour 


tous les x. EE 
C) Soit x* € Of (xo). Montrons qu'’alors tout x, est une solution 


du problème de programmation linéaire suivant 
Po (2) = Ji (x) — Ÿ (to) — Ÿ, à — xo) —+ ini, (8) 
OP: (x) Ji (x) En Î (To) En (ur TX — To) < 0,  Æ ln (9) 


ou bien l’assertion du théorème est valable. En effet, si la première 
affirmation n’a pas lieu, alors, pour un certain x, 


—— 


D'après la convexité, les mêmes inégalités seront satisfaites pour 
@œ € (0, 1) lorsque x, — (1 — a) x + ax, € int dom @, (proposi- 
tion À de 2.6.2; x, € int dom ,, puisque p, y est continue). Par 


conséquent, on peut supposer que x € int dom , et, en ce point, 
Po est continue (proposition 3 de 2.6.5). 
Par continuité, l’inégalité q, (x) 0 reste valable dans un certain 


voisinage convexe V 3 x, 1.e. 
fi (@) — 1 (@o) < GR, r— x), 2€ V. (11) 
Rappelons-nous maintenant que x* € 0f (x,), donc on doit avoir 
l'inégalité 
max {f1 (x), + -., fn (t)} — f (to) > A, à — &o). 
En la comparant avec l'inégalité (11), nous voyons que pour x € V 
on a l'inégalité 
p (x) = max {f; (x) |'iÆ ü} — f (to) — GG, æ — x0) 0. (12) 
En même temps, en vertu de (10), 
p (x) == max {4 (a) | à £ à} — f (ro) —(2*, 2 — 20) KO; 


de sorte que (x) — 0 et, d’après le lemme, z* € ôf (o), où 


f (x) = max {f; (x) li à}. 
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Puisque f est constituée de (7 — 1) fonctions, on a par hypothèse 
de récurrence 


a* Econv QU, 0fi, (To)} € conv QU of, (Xo)}e 


D) Si nous savons que x, est la solution du problème (8)-(9), 
nous pouvons nous servir du théorème de Kuhn-Tucker (voir 1.3.3); 
il faut ici faire appel à la remarque qui suit la démonstration de ce 
théorème : quoique d’après la proposition 3 de 2.6.2 nos fonctions 
sont continues sur int dom, elles peuvent prendre la valeur Ho 
en dehors de cet ensemble. 

En vertu du théorème de Kuhn-Tucker, il existe des multiplica- 
teurs de Lagrange À,, À; > 0, i Æ i,, qui ne s’annulent pas simulta- 
nément et pour lesquels x, est un point de minimum de la fonction 
de Lagrange 


£ (&3 2) = hop (9 + D Mo (9 


En outre, on doit avoir la condition de non-rigidité complémentaire 
en vertu de laquelle À; = 0 si ; (xo) = f; (xo) — f (to) Æ 0, i.e. 
pour i 4 I. En changeant le numéro de À, de manière à en obtenir 
À, et à obtenir p;, à la place de ®@,, nous pouvons écrire 


L (x, À) = 2 hp; (x ), 


et, puisque les multiplicateurs de Lagrange sont définis à un facteur 
positif près, on peut supposer que >, À; = 1. 
el 


Nous avons maintenant 


La D>E£ (th 2 Ap(1>0— 
2 hf; @)—(2 hi) f (0) — 
(Da), 122) >0e rt 82 if: (-)) (xo). 


ieI 


En appliquant le théorème de Moreau-Rockafellar et en tenant 
compte de l'égalité suivante qui découle immédiatement de la défi- 
nition de la subdifférentielle 


Ô (f) (to) = AO f (to) 
et qui est valable pour À > 0, nous voyons que 


=), h;a?, Ti C0f; (to); À; >0, dr hd 
iEI iCI 


CHAPITRE III 


PRINCIPE DE LAGRANGE POUR LES PROBLÈMES 


_ 


DIFFÉRENTIABLES À CONTRAINTES 


Le but principal de ce chapitre est la démonstration du principe 
de Lagrange pour les problèmes différentiables à contraintes sous 
forme d° égalités et d'inégalités, ainsi que la ne des conditions 
nécessaires d’extrémum pour les problèmes de ce type. Les résultats 
généraux de ce chapitre seront ensuite appliqués, dans le chapitre IV, 
aux problèmes du calcul des variations classique et aux problèmes 
de commande optimale. Puisqu'’une partie de ces questions, à un 
niveau élémentaire, a été déjà exposée dans le chapitre I, nous 
recommandons au lecteur de consulter parallèlement les endroits 
correspondants des $$ 1.3, 1.4. 


$ 3.1. Problèmes élémentaires 


3.1.1. Problèmes élémentaires sans contraintes. Soient: X un 
espace topologique, Ü un voisinage dans X et f: U—R. Le pro- 
blème 

f (x) — extr (3) 
est appelé problème élémentaire sans contraintes (il est sous-entendu 
ici et par la suite qu'il s’agit de problème d’extrémum). Dans le 
cas où À est un espace vectoriel normé et f possède telle ou telle 
propriété de différentiabilité, le problème (3) est appelé problème 
différentiable élémentaire; si X est un espace vectoriel topologique 
et j est une fonction convexe, alors le problème (3) de minimum est 
appelé problème convexe élémentaire. 

La définition d’ un extrémum local pour le problème (3) a été 


donnée dans 1.2.1. Si x fournit un minimum local (maximum, extré- 
mum) au PÉBIÈEe (3), nous écrivons brièvement 
x € loc min à ( € loc max 3, x E loc extr à). 


Les définitions des divers termes qui se rapportent à la notion de 
difiérentiabilité sont données dans $ 2.2. 
Nous commençons par le cas le plus simple: le cas unidimension- 


nel où XY = KR. 
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Lemme. Supposons que la jonction f: U— KR est définie sur 
un certain intervalle ouvert U = KR contenant le point x. 


a) Si f possède au point x des dérivées à droite et à gauche et x 6 
€ loc min 3 (loc max 3), alors 


j'(&æ+0)20, f'(c—0)<O('(&+O<O0, f—0>0). (1) 
Lorsqu'on a les inégalités strictes dans (1), x € loc min à (loc max 3). 
S'upposons en outre que la fonction f est k fois dif férentiable au point z. 


b) Si x Eloc min 3 (loc max 3), alors ou bien fl) (x) =0, 

1<Li<k, ou bien il existe un s, 1<s<[k/2], tel que 
j'a)... = 0-0 (à) = 0, 29 (20 (29 (x) <0). (2) 

c) S'il existe un 5, 1 L s L [k/2], tel que l’on a les relations (2), 
alors x € loc min à (loc max 3). 

L'’assertion b) pour 4 = 1 (x € loc extr à = f' (x) — 0) est bien 
connue en analyse : c’est le théorème de Fermat. Nous avons démontré 
ce théorème dans 1.4.1. 

Démonstration. L'’assertion a) découle immédiatement 
des définitions de la dérivée unilatère et de l’extrémum local. L’as- 
sertion b) pour k = 1 (le théorème de Fermat) découle de a) si on 
prend en considération le fait que l’existence de la dérivée implique 


les égalités f’ (x) = f’ (x + 0) = f’ (x — 0). Supposons en outre 
que 4 > 1 et, pour fixer les idées, supposons qu'il s’agit d’un mini- 
mum. D'après la formule de Taylor, on a 


k _—— 
f@+h)= > TEL ho (ht). (3) 
ÿ=0 
Soit f(x) —...—fm1N(x) =0, 1<m<k, fM (0 Un 


des deux cas suivants est possible : m est impair et mest pair. Dans 
le premier cas, supposons que p (Ë) = f (x + WE), EG R. Il découle 
alors de (3) que @ € D! (0) et p’ (0) = f(" (x)/ml 0, tandis que le 
théorème de Fermat affirme que l’on doit avoir @’ (0) — 0. La contra- 
diction obtenue montre que m doit être pair. Mais alors, en posant 


bp (#) = f (& + ÿ/E), Ë > 0, on obtient de (1) (+0) = f( (x)/m! > 
> 0, ce qui démontre l’assertion b). L’assertion c) découle immédia- 
tement de la formule de Taylor 


f (+ h)= f (x) + fCS(x) k ?s /(2s)! +o(h2s), 
qui montre que l'inégalité f(2s) (x) > 0 entraîne æ€ loc min à, Mais 
si f25) (x) <0, alors x € loc max à. M 
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Les assertions suivantes sont des conséquences presque immédiates 
des définitions. 

Théorème 1 (condition nécessaire d’ex- 
trémum du premier ordre). Supposons que X dans 
(3) est un espace vectoriel normé et que la fonction f a une dérivée dans 


la direction h au point x EU. 
Si xéloc min à (x E loc max 3), alors 
f'& h>0 (f(x 2)<0). (4) 
Corollaire 1. Supposons que f possède une première varia- 
lion (une première variation selon Lagrange) au point z. Si x € 
€ loc min 3 ( € loc max 3), alors 


ô,f(x, h)>0, VREX (6,f(x, 0, VREX) 
(ôf(x, h}=0, VREX). (5) 
Corollaire 2. Supposons que f possède une dérivée dans le 
sens de Fréchet (Gâteaux) au point x. Alors, si x € loc extr 3, on a 


f'(æ=0 (fa (x) =0). (6) 

L'’assertion du corollaire 2 est également appelée théorème de 

Fermat. Les points x pour lesquels on a l'égalité (6) sont appelés 
points stationnaires du problème (3). 

Théorème2 (condition nécessaire d’ex- 

trémum du deuxième ordre). Supposons que dans 

(3) À est un espace vectoriel normé et f possède une deuxième variation 


selon Lagrange au point x € U. Alors, si x € loc min à (x € loc max à), 
on a les relations suivantes: 


ôf(x, h)=0, VREX, (7) 
f(x, h)>0, VREX (f(x, h)X0, VhEX). (8) 


Démonstration. L'égalité (7) est contenue dans le corol- 
laire 1. Les inégalités (8) découlent immédiatement de la définition 
de la deuxième variation selon Lagrange et de l’assertion b) du 
lemme. M 

Corollaire 3. Supposons que f possède une dérivée seconde 


dans le sens de Fréchet au point x. Alors, six € loc min 3 (x Eloc max 3), 
on a les relations suivantes 


F Wet (9) 
f"(D>0 (f (HO). (10) 
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(Ces inégalités signifient que la forme quadratique d?f = 


= f" (x) [h, h] est non négative (non positive).) 
Démonstration. D’après la formule de Taylor (voir 
2:29); 


o(a)=f(&+ah)= f (2) + af (2) [A+ SF" (© [h, A] 0 (0), 
d’où l’on tire 
Ôf (x, h)=@" (0) = f' (x) [A], 
G2f (x, k)= p" (0) = j" (x) [k, A1, 


et il ne reste qu'à se servir de (7) et (8). M 

Le corollaire 2 affirme que les extrémums locaux sont des points 
stationnaires. Nous avons déjà mentionné dans 1.3.1 que la récipro- 
que est fausse. Pour obtenir une condition suffisante, il faut faire 
appel aux dérivées d'ordres supérieurs, comme nous l’avons déjà 
fait dans le lemme. 

Théorème3(condition suffisante d’extré- 
mum de deuxième ordre). Supposons que X dans (x) 
estun espace normé et f possède une dérivée seconde dans le sens de Fré- 
chet. Alors, si les relations 


f' (&)=0, (11) 
FEU, R>allkl, VAEX (f"()Ihk, hIS—aln|, VAEX) 
(12) 


sont vérifiées pour un certain à >> 0, il en découle que 
xEloc min à (x E loc max à). 


Démonstration. Si la première des inégalités (12) est 
vérifiée, alors, en appliquant à nouveau la formule de Taylor, on 
obtient 


j += (+ 14 fe, 1 +0 (4 D > 
> (++ A IP+ol A? > f (@), 


si ÀZO0 et || A || est suffisamment petit. Par conséquent, x € 
€ loc min 3. Le cas du maximum s’envisage d’une manière ana- 
logue. 

La condition (12) est appelée condition de positivité (négativité) 
stricte de la différentielle seconde de f. 
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Remarques. 1. Dans le cas de dimension finie, lorsque 
X — KR”, les assertions des théorèmes 1 à 3 sont bien connues d’après 
le cours d’analyse. Le théorème de Fermat signifie alors: 


f(2)=0 6f(x)/x; =... —0f(x)/0x, = 0. (13) 
Il découle de la condition nécessaire de deuxième ordre que, dans 


le problème d’extrémum de dimension finie l’assertion x€ 


6j (x) 
Ôx; 0x; 





€ loc min 3 implique que la matrice | est définie non négative : 





0?j (x) n 
S moe, at;20, VhER. (14) 
2, 71 


La condition de positivité de la matrice e 
on voit facilement, la positivité stricte de la différentielle seconde 
(et elle est donc une condition suffisante de minimum en un 
point stationnaire). Dans les espaces à dimension infinie ceci n’est 
plus vrai. 





| garantit, comme 


OO 


Exemple. Soient X— 4, f(x)— >) ((x?/n3)—xi) ; alors que le 
=1 


point z=0 est stationnaire, f’ (0) —0, tandis que la différentielle 
seconde de f à l’origine est définie positive 


J" (O)I#, À] ne hÿlns. 
— 


Toutefois, on a O0 loc min 3 car, sur la suite {e,/n}s=1 (où e; 
est le i-ième vecteur de base de l’espace /,), la fonctionnelle f prend 
des valeurs négatives f (e,/n) — (1/n5) — (1/n‘) < 0, tandis que la 
suite elle-même tend vers zéro. 

2. Dans le cas unidimensionnel, le lemme par lequel nous avons 
commencé ce sous-paragraphe donne une réponse, dans un certain 
sens exhaustive, à la question suivante: est-ce que le point donné 
d’une fonction f infiniment différentiable fournit un minimum local 
ou non, à savoir, à l’exclusion du cas trivial (lorsque toutes les déri- 
vées au point zéro s’annulent), le lemme donne la réponse cherchée. 
Même pour les fonctions de deux variables une procédure aussi com- 
plète n'existe sans doute pas. 

3. Les inégalités (12) imposent des contraintes importantes sur 
la structure de l’espace normé X. Si la première des inégalités est 


valable, la fonction symétrique bilinéaire (£ | n) — f” (x) LE, nl dé- 
termine sur À un produit scalaire, tandis que les inégalités 


If" GO INÉEPZEIE =/' © A >alEl 
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montrent que la norme engendrée par ce produit scalaire est équiva- 
lente à la norme donnée. Par conséquent, X est linéairement homéo- 
morphe à un espace euclidien (préhilbertien). En particulier, les inéga- 
lités (12) ne peuvent se rencontrer dans les espaces C et CT. 

3.1.2. Problème élémentaire de programmation linéaire. Au 1.2.6 
nous avons déjà écrit, dans ses traits communs, la classe des problè- 
mes de programmation linéaire. Nous considérerons ici le problème 
le plus simple de cette classe. Il nous intéresse parce que son étude 
nous permettra d'introduire des conditions importantes d’extrémum, 
à savoir, les conditions de correspondance et de concordance des signes, 
et la condition de non-rigidité complémentaire. 

Soit X — R?, a € R'* un élément de l’espace dual, a = (a,, . .. 

., 4n). Considérons le problème 


ax—inf (sup) =: }, a;x; inf (sup); (à) 
i—=1 


x; = (. 


Ici, le symbole = signifie que dans la contrainte correspondante on 
a un des trois symboles >, ou —. Le problème (3) sera appelé 
problème élémentaire de programmation linéaire. 

Nous dirons que la condition de correspondance des signes (pour 
les contraintes x; Z 0) est remplie pour le vecteur a si a; > 0 avec 
la contrainte x; > 0, a; < 0 avec la contrainte x; < 0 et a; est de 
signe quelconque lorsque la contrainte prend la forme d'égalité 
x; = 0. Dans le cas où ces inégalités changent de sens, i.e. si a; > 0 
avec la contrainte x; < 0, a; L O0 avec la restriction x; > 0 (et 
à nouveau a; est de signe quelconque pour x; — 0), nous dirons que 
la condition de concordance des signes est remplie. Dans le premier 
cas, nous écrirons a; = Ü, dans le deuxième a; < 0. 

Théorème (condition nécessaire et suî- 
fisante d’'extrémum pour le problème élé 
mentaire de programmation linéaire). Pour 


que le point x € R” donne un minimum (maximum) absolu au problème 
(3), il est nécessaire et suffisant que l’on ait les conditions suivantes: 
a) la condition de correspondance (concordance) des signes 


a 0 (a = O0), (1) 
b) la condition de non-rigidité complémentaire 
a;T; CE 0, L —= Le ss 7. (2) 


Démonstration. Supposons que (3) est un problème de 
minimisation et que la i-ième contrainte est de la forme x;, > 0. 
Si l’on suppose que a;, < 0, alors la borne inférieure dans le problè- 
me (3) est égale à — co, car x;, peut prendre des valeurs positives aussi 
grandes que l’on veut. Par conséquent, la condition a;, > 0 est néces- 
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saire pour que la valeur du problème (l’inf cherché) soit finie. Si 
l’on admet maintenant que di £ 0, alors d’après la condition 
Ti > > 0 et l'inégalité démontrée a;, > 0 on a en fait dtio > (. 
Mais alors le point x ne sera pas une minimale du problème, car sur 
tout vecteur admissible z — = (7, re Lio 0, Re ns t,) on 


a ax < ax. La suffisance des conditions (1), (2) est évidente. Si, pour 
préciser, (3) est toujours considéré comme un problème de mirimi- 
sation et on a les conditions de correspondance des signes et de non- 
rigidité complémentaire, alors pour tout vecteur admissible x € R' 


nous obtenons ax > 0, alors que pour x, d'après (2), on a ax = 0. 


Exercice. Déduire le théorème démontré ci-dessus du théorème de 
Kuhn-Tucker. 


3.1.3. Problème de Boltz. Soit À un intervalle fini et fermé de la 
droite réelle. Considérons l’espace de Banach 


= C'(A RÔXRXER, 


constitué des éléments £ = (x (:), {,, t,). Dans cet espace, envisa- 
geons le problème 


BE) — 8 (x(-), to, ts) = 
1 


: | L(t,2(#), 2(é)dt +1 (bo, & (bo); ls (1) extr. (à) 


lo 


Dans (3), les fonctions ({, x, x) L'(t, x, x) et (to, Zos tas da) — 
— L(los Los Lis T1) Sont définies dans des sous-ensembles ouverts 
V et W des espaces R X R? X R'et R X R° X R X R’ respective- 
ment et ts, t, € À. Les deux fonctions seront supposées au moins 
continues. Le problème (3) est appelé problème de Boltz à temps non 
fixe, tandis que la fonctionnelle dans (3) est la fonctionnelle de Boltz. 
Dans 1.4.2, nous avons considéré un cas particulier où n = 1 (le 
cas n >> 1 n’a été mentionné que brièvement) et les temps & et # 
étaient fixes. 

Lemme. Supposons que les fonctions L et l, ainsi que leurs 
dérivées partielles L,, Le, le, et Le, i — 0, 1, sont continues dans les 


domaines V et W respectivement. Alors la fonctionnelle & est continü- 
ment différentiable (selon Fréchet) sur le sous-ensemble ouvert suivant 


Len, 


de l'espace E: 
= {& = (x (-), to t1) 1t (+) E CT (A, R7); 
(t, xt), s ONE V, € A; (bo © (és) tas € (h1)) EW; for À E int A}, 
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et l'on a 


> 
, 


B'(c (+), do À) LAC) to Ul= | (Lx (6) R (4) + 


+ L. (E) h (#)) dt + L (à) mi — 2 (bo) To + to + 


+) 


+ mit, (h (bo) +7 (bo) To) + des (A (61) +3 (bo) Ta), (1) 


où 
LO=L(, 20,20) LO=L(E 20, #0), 
L. () = L. (e, x (t)), (0), =, (los ro): ts z(b)): 
Le, = Le, (os & (to): Es T(h)), 1=0, 1. 


Démonstration. La fonctionnelle & est la somme des 
fonctionnelles intégrale et terminale. Le fait qu’elles sont continû- 
ment différentiables a été démontré dans 2.4.2 et 2.4.3. (La fonction- 
nelle terminale Ë — 7 (f,, x (to), t1, æ (t,)) est un cas particulier 
de l’opérateur des conditions aux limites.) Pour obtenir (1), il n'y 
a qu'à se servir des formules (9) de 2.4.2 et (3) de 2.4.3. M 

En vertu de ce lemme, (3) est un problème différentiable élé- 
mentaire sans contraintes. Par conséquent, nous pouvons y appliquer 
les conditions nécessaires et suffisantes d’extrémum de 3.1.1. Si 
l’on déchiffre alors l’assertion du théorème de Fermat, on obtient 
le théorème suivant. 

Théorèmel (condition nécessaire d'ex- 
trémum de premier ordre pour le problème 
de Boltz). Supposons que les hypothèses du lemme sont remplies. 
Si l'élément 


E=(x(.), Lo) )EE 
appartient à l'ensemble 9 et fournit un minimum local au problème 
(3), alors 
1) les conditions de stationnarité par rapport x (+) sont satisfaites: 
a) on a l'équation d'Euler 


d # An 
— TE. (D+É(=0, (2) 
b) la condition de transversalité par rapport à x 


L. G)=(—1) Es i=0, 1; (3) 
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2) les conditions de transversalité par rapport à t sont satisfaites: 
H()=(—141h, i=0,1, (4) 


À (= L. DEO—È (#. 


Nous avons déjà rencontré les relations (2) et (3) dans 1.4.2. 
Nous rencontrons ici pour la première fois les conditions de transver- 
salité relativement à t, mais nous les retrouverons constamment au 
chapitre 4. 

Démonstration. Nous avons déjà mentionné que le 
problème 3 est un problème différentiable élémentaire ; le théorème 
de Fermat y est donc applicable (corollaire 2, 3.1.1) ; d’après celui-ci 


Ë € loc extr3 = #" (Ë) 0 #'(Ë) [In] =0, 
Vn=(k(:), To T1) EE. (®) 
En faisant appel à (1), nous obtenons de (5) 
0= #' À) In] = 


= À (x (6) À (6) + L (#) À (0) dé + ao (Eo) + 
% 


+ he (£a) + Boto + Pita: (6) 


où, pour simplifier, nous avons introduit les notations suivantes: 
Gus Bite, Het (En) +(—APHÉ (ES), 120,4 (7 


La relation #'’ (Ë) [nl — 0 a bien lieu pour tout élément n — 
= (A(:), To, M). Envisageons d’abord les éléments de la forme 
n = (A(:), 0, 0), RECT(A, R"), h(t;) = 0, i — 1, 2. Alors il dé- 
coule de (6) que 


À (Éx (0) % (0) + £. (D À (D) dt = 0 (8) 
de 


pour toute fonction vectorielle k (+) € C1 ([éo, 1, R") telle que 


h (é) — h (t,) — 0. Mais nous avons déjà rencontré cette situation 
dans 1.4.1. D’après le lemme de Dubois-Raymond, qui y avait été 
démontré pour les fonctions scalaires, nous obtenons immédiatement 
la relation (2) (dans 1.4.2 le lemme de Dubois-Raymond avait été 
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démontré pour les fonctions scalaires, et ici il doit être appliqué à tour 
de rôle à chaque composante de la fonction vectorielle X (+); en 
posant A ()= ... =kii()=hkn() =... =hn() =0, 
nous réduisons (8) à une relation scalaire analogue à une seule compo- 
sante h; (+) et obtenons la i-ième équation du système (2). Nous 


démontrons alors en même temps le fait que Z. (&) est continûment 
X 


différentiable. Mais on peut alors effectuer, dans l'expression (6), 
une intégration par parties qui donne (si l’on se sert de (2)) 


0 = B' (Ë) In] = (Go — Le (É0)) À (to) + 
+ (au Le (E)) À (4) +Boro+ Bis (9) 


pour des vecteurs À (£,), h (t,) et des nombres vt, et 7, arbitraires. 
ne l'on tire immédiatement en se servant de (7) les relations (3) 
et 4). dé 

Comme nous voyons, la démonstration du théorème est essentiel- 
lement la même que celle donnée au chapitre I. Sauf qu'’alors nous 
avions calculé les dérivées par les moyens du bord, tandis qu'ici 
nous nous servons des théorèmes du calcul différentiel provenant des 
$$ 2.2 et 2.4. 

3.1.4. Problème élémentaire de commande optimale. Soit 1 un 
espace topologique et @: [éo, ti] X U — R. Considérons le problème 

ti 


f@())= | pt u (6) dé ini (3) 
to 
dans l’espace XC ([ts, t.l, U) des fonctions u (+): [t,, t,1] — Ü con- 
tinues par morceaux à valeurs dans Ü. La fonction œ@ sera supposée 
continue dans [f,, t1l X M. Le problème (3) sera appelé problème 
élémentaire de commande optimale. 

Théorème (condition nécessaire et suî- 
fisante de minimum pour le problème élé- 
mentaire de commande optimale). Supposons que 
la fonction u (-) appartient à KC (lt, t,l, Ü) et fournit un minimum 
absolu au problème (3). Alors, pour tout point de continuité de la fonc- 


tion u (-), on a la relation 
min f(£, u)=f (£, u(). (1) 


Démonstration. Supposons que la relation (1) n’est 
pas remplie et qu’il existe un point tv (de continuité de la fonction 


ü (-)) et un élément v € U tels que f (x, v) f(x, u (x)). Les fonc- 


tions tr ft, vietitr f (fé, u (t)) étant continues, il existe dans un 
voisinage du point Tt un intervalle fermé A = [rt — 6, x + ô] tel 
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que f (t, v) << f (#, u (£)) pour t € À. Posons u (t) = à (t) pourté À 
etu(t) = v pour {€ A. Alors / (u (-)) <f (u (-)), malgré la minima- 
lité de u (-). 


3.1.5. Le principe de Lagrange pour les problèmes à égalités et. 
à inégalités. Au chapitre I, nous avons plusieurs fois discuté le 
principe en vertu duquel on obtient les conditions nécessaires pour 
les problèmes à contraintes. Maintenant, après avoir distingué quel- 
ques problèmes « élémentaires », nous pouvons faire une sorte de 
résumé. 

Les problèmes d’extrémum considérés ont été énoncés de manière. 
à diviser les contraintes en deux groupes, dont le premier consistait 
d’égalités. En nous servant des contraintes de ce groupe, nous avons 
construit la fonction de Lagrange. Ensuite, nous avons posé mentale- 
ment le problème d’extrémum correspondant pour la fonction de 
Lagrange relativement au deuxième groupe de contraintes, celles qui 
n'avaient pas participé à la construction de la fonction de Lagrange. 
Il s’est alors avéré que le problème d’extrémum ainsi obtenu était 
soit un problème élémentaire, soit un problème qui engendrait 
des problèmes élémentaires « partiels », obtenus en fixant toutes les 
variables sauf une. Les conditions nécessaires pour les problèmes 
élémentaires obtenues dans leur ensemble nous donnaient justement 
la famille des conditions nécessaires d’extrémum cherchées. Nous 
laissons au lecteur le soin de vérifier que toutes les conditions néces- 
saires d’extrémum dont il s'agissait au chapitre [| et toutes les con- 
ditions nécessaires dont on parlera au chapitre IV s'accordent avec 
la procédure décrite. La seule exception est donnée par les problèmes 
à inégalités, dans lesquels des conditions supplémentaires apparais- 
sent. Ces problèmes seront étudiés en détail dans le paragraphe sui- 
vant, tandis qu'ici nous montrerons qu'ils peuvent eux aussi être 
inclus dans le cadre du « principe de Lagrange » que nous venons de 
décrire. 

Supposons (pour fixer les idées) que nous avons un problème de 
minimisation 


fo) inf; Fa =0, fm E<0, i=1,...,m, (G) 


TT 


où, en outre des égalités, nous rencontrons également des inégalités 
(X et Y dans (3) sont des espaces vectoriels topologiques, f;: X —+ R, 
F: X— Y). En introduisant des nouvelles variables u;, nous pou- 
vons mettre le problème (3) sous la forme 


fox) inf; Fr) =0, f;(x) + u; = 0, 
WU 0, L=1À;.::2:5 mm: (3) 


Décomposons les contraintes en deux groupes, dont le premier con- 
siste des égalités (F (x) = 0, f; (x) + u; = 0) et le deuxième des 
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contraintes de la forme uw; Z 0. Pour le problème (3), constituons 
la fonction de Lagrange, en laissant de côté les contraintes du deuxiè- 
me groupe: 


Z (x, U, ur, À, Li Àofo (&) + 
+S Ai) +u) +, Fa), = (4 ce, À): 


et en fixant le signe du facteur À, (pour le problème de minimum : 
ko > 0, et de maximum: À, & 0). 

Dans le problème de minimisation de la fonction de Lagrange 
(pour les multiplicateurs fixes) 


L (x, U, y*, À, Âo) — inf 
il y a deux groupes de variables x et u. Si l’on fixe les variables 


u — u, on obtient le problème élémentaire sans contraintes (diffé- 
rentiable, convexe, etc.); ici on peut écrire la condition nécessaire 


d’extrémum appropriée et, comme on voit facilement, u; n’apparais- 


sent pas dans cette condition. Mais si l’on fixe les variables x = x, 
on obtient le problème élémentaire de programmation linéaire. 
Les conditions d’extrémum énoncées en accord avec 3.1.2 nous 
donnent la condition de correspondance des signes des multiplica- 


teurs de Lagrange À 


à, = 0 (1) 
et les conditions de non-rigidité complémentaire 
hu; = 0 <=: hf, (&)—0. (2) 


Par la suite, nous allons nous servir à chaque fois de cette procé- 
dure, mais, si nous avons des contraintes sous forme d'inégalités, 
en construisant la fonction de Lagrange, nous l’écrirons tout de 
suite sous la forme brève 


L (x, y*, À, bo) = Lil: (t) + (y, EF (x)) 


et c'est justement cette fonction que nous appellerons fonction de 
Lagrange du problème (3). Il faut seulement avoir en vue qu’à 
ces conditions d’extrémum relativement à x il faut ajouter les rela- 
tions qui découlent de (1), (2), à savoir, les conditions de concordance 
des signes 

fi (@ S0=û > 0 cu 


et de non-rigidité conpémentaine 


lif; (x) = 0. 
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Remarquons maintenant que le principe de Lagrange (ainsi 
que, par exemple, le théorème de Fermat pour le problème d'’extré- 
mum différentiable) donne seulement des conditions nécessaires 
d’extrémum, i.e. distingue l’ensemble des objets « suspects », mais 
ne démontre pas leur « culpabilité ». Par conséquent, pour obtenir 
une solution complète du problème, il faut avoir des conditions suf- 
fisantes d’extrémum, ou bien être sûr que la solution existe. 

La première situation permet « d’effectuer l'expertise »: chacun 
des objets distingués par les conditions nécessaires doit être vérifié 
pour sa suffisance. Ayant trouvé parmi eux celui qui vérifie les con- 
ditions suffisantes, nous décidons que le problème est résolu. 

Dans la deuxième situation, la solution cherchée (dont l'existence 
est connue à priori ou a été démontrée) doit faire partie des objets 
suspects qui vérifient les conditions nécessaires d’extrémum. En cal- 
culant pour chacun d’eux la valeur de la fonctionnelle, nous prenons 
pour solution celui pour lequel cette valeur est extrémale. 

Il va de soi que l’on ne peut accorder une fois pour toutes la pré- 
férence à l’une des deux méthodes. Les conditions suffisantes ne coïn- 
cident généralement pas avec les conditions nécessaires, et, par consé- 
quent, il peut rester des « suspects » dont la « culpabilité » n’a 
pas été établie (par exemple, les théorèmes de 3.1.1 ne donnent pas d’in- 


dication sur l'existence ou l’absence d’extrémum au point x pour 


#n 


une fonction « plate » f (x), pour laquelle f(*) (x) — 0 pour tous les 
k). D'autre part, même si nous savons que la solution existe, il nous 
sera difficile de trouver la solution cherchée si les conditions néces- 
saires distinguent un ensemble infini (ou même très grand) d'objets 
suspects. 

Dans la majorité des cas, l’existence de la solution s'établit 
en se servant de diverses modifications du théorème classique de 
Weierstrass, déjà mentionné dans 1.6.1: l’existence est une consé- 
quence de la compacité de l’ensemble des éléments admissibles et de 
la semi-continuité de la fonctionnelle. 

Définition. La fonction f: À +R, définie sur l’espace 
topologique X, est dite semi-continue inférieurement au point x 
si lim f (x) > f (xo) ; f est tout simplement semi-continue inférieure- 


X—X0 : . 
ment, si elle est semi-continue inférieurement en chacun de ces 


points (comparer à 2.6.2). 

Théorème de Weïerstrass. Toute fonction semi- 
continue inférieurement f: X — KR atteint son minimum sur tout sous- 
ensemble dénombrablement compact d'un espace topologique X. 

Démonstration. Supposons que À & À est un sous- 
ensemble dénombrablement compact et $S la valeur du problème 


f(x) — ini, zx€EAÀ, (3) 
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1.0. 
S— int f (x). 


xE A 
D'après la définition de la borne inférieure, nous pouvons choisir 
une suite minimisante du problème (3), i.e. une suite de points 
2n € À telle que f (x,) — S. D'après la définition de la compacité 
dénombrable, on peut choisir dans x, une sous-suite Th), qui converge 


vers un certain point x € A. D'après la semi-continuité, 
f (2) lim f (an) = lim f (an) = 8 
—+ OO n — Co 


et puisque, d'autre part, f (x) ne peut être inférieure à la valeur du 


problème (3), f (x) = S, i.e. x est un point de minimum. 

Corollaire. Supposons que f est semi-continue inférieure- 
ment sur l’espace topologique X. Si un certain ensemble de Lebesgue 
Laf = {x |f(x) La} de la fonction f est non vide et dénombrable- 
ment compact, alors f atteint son minimum sur X. 


$ 3.2. Principe de Lagrange pour les problèmes différentiables 
à contraintes sous forme d’égalités 
et d’inégalités 


3.2.1. Enoncé du théorème. Considérons le problème d’extrémum 
fo(æ)—extr; F(x)=0, f;(x)=<0, i—=1,...,m. (1) 


Le symbole f;, (x) = 0 signifie que la i-ième contrainte est soit 
de la forme f; (x) = 0, soit f; (x) < 0, soit f; (x) > 0. 

Les problèmes du type (1), où X et Y sont des espaces normés, 
{. des fonctions différentiables sur X et F est une application diffé- 
rentiable de X dans Ÿ, sont appelés problèmes d'extrémum diffé- 


rentiables à contraintes sous forme d'égalités et d’inégalités. 
La fonction de Lagrange pour le problème (1) est la fonction 


& (a, ph h)= 2 fa) +G*, F(), (2) 


où À = (À, ..., Am) ER, MER, y* E Y* sont les multiplicateurs 
de Lagrange. 

Théorème (méthode des multiplicateurs 
de Lagrange pour les problèmes différen- 
tiables à égalités et inégalités). Soient X et Y 
des espaces de Banach, U un ouvert dans X,f;: U—R,i— 0, 1, ... 

., M, des fonctions et F: ÙU — Y une application strictement dif fé- 


rentiables au point x. 
16-0237 
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Six fournit un extrémum local au problème (1) et si 
l’image Im F” (x) est un sous-espace fermé de Y, (3} 
il existe des multiplicateurs de Lagrange y*, À, ho pour lesquels sont 
vérifiées : | 
a) la condition de stationnarité de la fonction de Lagrange relati- 
vement à x: 
Las ÿ*, ns Ào) = 0: (4) 


#” 


b) la condition de concordance des signes: À, > 0 s'il s'agit du 
problème de minimum, Ào < 0 s’il s'agit du problème de maximum 


UZ&0, i=1,...,m: (5) 
c) les conditions de non-rigidité complémentaire 
hf —=0, i=1,...,m. (6) 


Rappelons encore que la notation de Z 0 signifie que, dans les 
conditions du problème (1), si l’on a f,(x)>0, alors 2.,<0, si 


fi (x) LO, alors À,>0, et enfin, si f;, (x) —0, alors À; peut être de 
signe arbitraire. 

L'’affirmation d'existence des multiplicateurs de Lagrange véri- 
fiant l’ensemble des conditions a) à c) est en accord avec le principe 
général de l’élimination des contraintes: c’est justement ce principe 
qui a été discuté dans le dernier sous-paragraphe du paragraphe 
précédent. Par conséquent, le résultat énoncé sera également appelé 
principe de Lagrange pour les problèmes différentiables à égalités 
et à inégalités. 

La démonstration du théorème général est fondée, d’une part, sur 
le théorème des fonctions implicites du $ 2.3 et, d'autre part, sur le 
théorème de Kuhn-Tucker, i.e., en fin de compte, sur le théorème de 
séparabilité de dimension finie. Le théorème de Kuhn-Tucker a été 
démontré dans le $ 1.3, et notre renvoi à ce théorème est essentielle- 
ment le seul renvoi important au premier chapitre dans cette partie 
du livre. La nécessité de faire appel au théorème de Kuhn-Tucker 
est liée au fait que des inégalités apparaissent dans (1), ce qui com- 
plique quelque peu la démonstration. Le cas où les inégalités sont 
absentes est tout à fait simple, mais en même temps instructif et 
intéressant. Nous le considérerons donc séparément, quoique, bien 
sûr, ce cas est une conséquence automatique du résultat général. 
Pendant la lecture du sous-paragraphe suivant, nous recommandons 
au lecteur de comparer parallèlement la variante de dimension 
infinie de la démonstration à celle de dimension finie que nous avons 
considérée dans 1.3.2. 


$3.2] PROBLÈMES À CONTRAINTES DU TYPE ÉGALITÉS ET INÉGALITÉS 243 


3.2.2. La méthode des multiplicateurs pour les problèmes diffé- 


rentiables à égalités. 
Théorème (le principe de Lagrange pour 
les problèmes différentiables à égalités). 
a) Soient X et Ÿ des espaces de Banach, U un ouvert dans X, 
f: U—=R, F: U— Y une fonction et une application strictement 


différentiables au point x. 

Si le point zx est un point d'extrémum local pour le problème 

f(x) — extr, F(x) = 0 (1) 

et si l’image Im F' (x) est un sous-espace fermé de Y, alors il existe des 
multiplicateurs de Lagrange À CRet y* € Y* pour lesquels on a la 
condition de stationnarité de la fonction de Lagrange: 

L(&, v*, lo) =0< of’ (D, 2) +(ÿ*, F'(&)Ix)=0, Vz. (2) 

b) Si l’on a la condition de régularité pour l'application F, i.e. 
si Im F” (x) coïncide avec l’espace YŸ tout entier, alors le multiplicateur 


À n'est pas nul. 
Nous effectuerons d’abord la démonstration pour le 
problème de minimum. Définissons l’application 


FR=(@—-1(@, F@), FI'U—+RXTY. 
L'application # est de toute évidence strictement différentiable 
en æet F°(x) = (f(x), F' (x). 

Deux cas sont possibles, suivant que l’image Im #° (x) coïncide 
ou non avec l’espace R X Y. 

A) Considérons d’abord le cas Im F' (2) R X Y. Appliquons 
à l'application F° (x) le lemme sur l’image fermée (2.1.6). L'image 
In F” (x) est fermée par hypothèse, l’image f” (x) (Ker F (x)) est 
soit {0}, soit R, i.e. est un sous-ensemble fermé de R. Par consé- 
quent, d'après le lemme cité, l’image Im F” (x) est fermée dans 
R X YŸ. Puisqu'’elle ne coïncide pas avec R X Y, Im #”’ (x) est 
un sous-espace fermé propre. D’après le lemme sur la non-trivialité 


de l’annulateur (2.1.4), il existe un nombre À et un élément y* 
(voir 2.1.2, où il s’agit de la forme générale d’une fonctionnelle 
linéaire dans le produit d'espaces) qui ne s’annulent pas simultané- 


ment (10 1+ ||y* || 0) et tels que 

(of (2), ©) +(y*, F' (x) x)=0, Vz. 
Mais cette relation coïncide avec (2). 
16+ 
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B) Supposons maintenant que Im #° (x) — R X Ÿ. Alors nous 
pouvons appliquer le théorème sur l’existence de la fonction implicite 
{voir 2.3.1 à 2.3.3). 

D'après ce théorème !), il existe une constante À >> 0, un voi- 
sinage 7 du point (0, 0) dans l’espace R X Y et une application 
p: 7% — X tels que 


Fe (a D) = y et pa n—zl< 
<£IFDH—(& WI. @) 
Posons x (£) — @(—e, 0) — œ(z(e)). Alors on tire de (3) 
Fat) =) ft) —f(@=—e F(&(E)=0 (4 
Ur(e) —x=fp((e) —zi< 
<KI1(O, 0) —(—e 0 =Ælel (5) 
I] découle de (4), (5) que x (£) est un élément admissible pour le 
problème (1) aussi proche que l’on veut de x et en même temps on 
a f(x (E)) < f (x), ie. x é loc min (1). Cette contradiction montre 


que l'égalité Im 7° (x) — R X Y est impossible. L'assertion a) 
du théorème est donc démontrée. 


C) Supposons que F est régulière au point x et À = 0. Alors 
y* 0 et la relation (2) se met sous la forme (y*, F (x) (tl}= 0; 
Vz. Choisissons un élément y de manière à avoir (y*, y) 0 (ce 
qui est possible, car y* 3 O) et trouvons un élément x tel que 


F" (x) [x] =y (x existe en vertu de la relation [Im (x) = Y): 
Alors 0  {y*, y) — (y*, F (x) [x = 0. Cette contradiction démontre 
la deuxième assertion du théorème. M 


Remarque. Nous avons effectué la démonstration selon le même sché- 
ma que celui qui fut employé pour établir la méthode des multiplicateurs de 
Lagrange en dimension finie (1.3.2) et elle s’est avérée aussi simple et brève. 


1) Il faut mettre en correspondance les notations du théorème 2.3.1 avec 
les notations du présent sous-paragraphe. X, l’espace topologique dans le théo- 


rème des fonctions implicites (f.i.), consiste ici du seul point {xo}, Y (Li) —X, 
ZÉISR XY, Ya y) = Yo DES F(E), À Fi) F' 6), 
v(i)>r, 20 (i.)<0 € R X Y. La condition 1) du théorème est vérifiée 


trivialement, la condition 2) est vérifiée en vertu de la différentiabilité stricte 
de #, car 


Van v)— Vu y)—-AU—-Y) SF (x) —F(x") —F' (al — 1, 


et enfin la condition 3) a lieu puisque Im F° (x) — KR X Y. 
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Il est vrai, une certaine préparation a été nécessaire : nous nous sommes servis 
de trois faits d'analyse fonctionnelle, à savoir, le théorème sur la non-trivialité 
de l’annulateur (i.e., en fin de compte, le théorème de Hahn-Banach), le lemme 
sur l’image fermée et le théorème des fonctions implicites. Pour terminer le 
théorème général — démontrer la méthode des multiplicateurs pour les pro- 
blèmes à inégalités — il nous faudra, en plus de ces trois faits, également le 
théorème de Kuhn-Tucker qui est une conséquence directe du théorème de sépa- 
rabilité en dimension finie (voir F) dans la démonstration du théorème dans 
8.2.4). Il est remarquable qu'avec des moyens si limités, se rapportant aux struc- 
tures mathématiques générales, nous avons obtenu un résultat dont l’une des 
conséquences directes, obtenue par des moyens auxiliaires également d'ordre 
général (le théorème de Riesz sur les fonctionnelles linéaires dans l’espace C 
et les théorèmes standards de la théorie des équations différentielles) nous 
donnera, dans le chapitre suivant, des résultats concrets importants: les con- 
ditions nécessaires d’extrémum pour les problèmes du calcul des variations 
classique et les problèmes de commande optimale. 


3.2.3. Réduction du problème. Avant de commencer la démons- 
tration du théorème énoncé dans 3.2.1, nous allons effectuer certai- 
nes transformations de ses hypothèses. D'abord, en remplaçant 
s’il le faut f, par (—1) fo, nous réduirons le problème à un problème 
de minimum. Si, parmi les contraintes de la forme f; (x) < 0 ou 


f; (x) > 0, il y en a quelques-unes pour lesquelles }; (x) <T 0 ou 


respectivement }; (x) > 0, nous les mettrons de côté, puisque du 
point de vue local elles ne sont pas essentielles, car elles sont véri- 


fiées en tous les points d’un certain voisinage du point x. En outre, 


si la relation (1) de 3.2.1 contient des inégalités f; (x) > 0, f; (x) = 0, 
nous les remplacerons par les inégalités (—1) f; (x) < 0. Les égalités 
fi (x) = 0, par contre, seront ajoutées à l'égalité F (x) — 0. Rénumé- 
rotons maintenant toutes les inégalités qui donnent les contraintes ; 
nous obtiendrons alors le problème suivant, équivalent à (1): 


fo(t) int, F(x)=0, f,(m<0, j—=1,...,m, (1 


où F(&)=(F (2), Fe, (2)... fa (@)) et pour chaque j, 0<j<y, 


il existe des i; et e;— +1 ou —1 tels que 


(0 = fi, (). (2) 


Dans le problème (1”) le point x fournit un minimum local et l’on 


a f5(2) = 0, j=1,..., m. 
Montrons maintenant que toutes les hypothèses du théorème 


sont remplies pour le problème (1). En effet, X et Y x Ru-" sont 
des espaces de Banach. Les fonctions A et l’application F sont 
strictement différentiables au point z (puisque F et f; l’étaient). 
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I1 ne reste qu’à montrer que L — Im F' (x) est fermé dans Y X Ru-7, 
On a Ê" (x) — (F' (à), D’ (), où 


D @ = (2, @ 2, Ga @, 2, v'@: X RU, 


L'image Im 7" (x) est fermée par hypothèse, tandis que le sous- 


espace D’ (x) [Ker F' (x)l GC Ru-" est fermé, comme tout sous- 
espace d’un espace de dimension finie. Par conséquent, d’après 


le lemme sur l’image fermée (2.1.6), Im a (x) est fermée dans 


Y X Ru-m. 
Supposons maintenant que le théorème est vrai pour le _ pro- 


blème (L° ) et il existe donc des multiplicateurs de Lagrange y* 


= (y*, à. port Li) 1e j = 0, 1, , m, pour lesquels on 
a a)et b) de 3.2.1 (les conditions c) sont | vérifiées automatiquement 
puisque 1; (x) 0771. :.2 m). D'après b), à; > 0, j =0, 
1,..., m, et d’après a) 


La Ce, 0%, dues, go 0 =) RP @ +) (—=0, (3 


Is 


« 


ou 


m 
L= TZ hf; (a) + (U*oF) (»). 
2—= 
Il ne reste maintenant qu’à poser ES Li, = eh, = 2 


#n PJ 


M, hi,=À;; j=m+i,...,n 


et À, = 0, lorsque f; (x) - 0. La famille obtenue vérifie, ce qui est 
évident. les conditions de non-rigidité complémentaire et la con- 
dition de concordance des signes (car dans (2”) on a &; = +1 lorsque 
la contrainte est de la forme fi, (x) L O0 et e; — —1 pour }j; | > 0). 


En outre, puisque 


L (x, y y* a ho) = £ (x; y*, Nr lo): 


la condition de et de la fonction de Lagrange est vérifiée 
ou ne l’est pas pour les deux fonctions simultanément. 

Ainsi, par la suite, nous pouvons nous limiter à l’étude du pro- 
blème (1’). Néanmoins, pour simplifier, nous n'’écrirons plus le 
signe — au-dessus de F, f; et m. 
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3.2.4. Démonstration du théorème. Ainsi, étant donné le problème 
fo(@)— inf; F(x)=0, f;()<0, j—=1,...,m, (1 
supposons que toutes les hypothèses du théorème de 3.2.1 sont rem- 
plies et que l’on a }; (x) — 0, j —1,..., m. Sans perte de géné- 


ralité, on peut supposer également que jf, (x) = (0. 

La démonstration sera effectuée en plusieurs étapes. 

A) Le cas linéaire. Considérons d’abord la situation 
Ja plus simple, lorsque f, — x* est une fonctionnelle linéaire, f;, = 0, 
i—1,..., m, tandis que F — À est un opérateur linéaire continu 


surjectif. Le point z = 0 est la solution du problème 
{a*, x) inf; Ax=0 (AE Z(X, Y)}, A(X)=}Y) (2) 
si et seulement si x* € (Ker A)t. D’après le lemme sur l’annulateur 
du noyau (2.1.7), il existe un élément y* € Y* tel que x* + AXy* = 
— (0. Mais cette relation est précisément le principe de Lagrange 
pour le problème (2): 
z* L AXy* = £, (0, y#, 1) = 0, 


où L (x, y, Ào) = ho (a, 2) + (y*, Az) = (kot* + Ay*, x) est 
la fonction de Lagrange du problème (2). Ainsi dans cette situation 
le principe de Lagrange est vérifié. 

B) Le cas dégénéré. Im 7” (x) est un sous-espace propre 
de Y. D’après le lemme sur la non-trivialité de l’annulateur (2.1.4), 
il existe un élément y* € (Im F° (x))+ = (y* o F”) (x) — 0. Il ne 
reste qu'à poser de — 0, i—0,..., m, et vérifier que le principe 
est valable dans le cas dégénéré en considération. 

Nous supposons maintenant que F est un opérateur régulier au 
point x, i.e. Im F’ (x) re 

Posons, pour 0 < k < m, 
Ar={xr|((), mD <0, ik k+1,... 

., M, F' (x) [xl = 0}. 
C) Lemme (le lemme principal). Si x est une 


solution locale du problème (1), alors l’ensemble À, est vide. Autre- 
ment dit, 


max (fi (x), x) >0, Vx£CKer F’ (x). 


0<Li<m 


Démonstration. Supposons que À, est non vide, i.e. 
il existe un élément & tel que 


F'(DIE=0, (f(), Dr B<0, 0<i<m. 
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Alors, d’après le théorème de Lusternik (voir 2.3.5), il existe une 
application r: [—a, al X, x >=>0, telle que 


F(z+E+r()=0, À€El—0&, al, r(A)—o(). (3) 


Pour des À > 0 petits, nous avons pour i — 0, 1, ..., m les iné- 
galités 


fe (+ ME + r Q) = fi (@) + À Gi (à, D + 0 (à) = 
= Àf; + 0 (À) < 0. (&;) 

Les relations (3) et (4;), i — 1, ..., m, signifient que pour des 
valeurs de à > 0 petites, l'élément x + EE +r (À) est admissible 
pour le problème (1). Mais alors l’inégalité (4;) est en contradiction 
avec la minimalité locale de x. 

D) Lemme 2. Si A, est l’ensemble vide, alors le principe de 
Lagrange est valable pour le problème (1). 


Démonstration. À, étant vide, on voit que x — 0 est 
une solution du problème 


Jan), tint, F'(&) [x] —0. 


D'après A), le principe de Lagrange pour ce problème est valable. 
et donc il est également valable pour le problème (1) (il faut seule- 


ment poser À —... — —— — (), 
Ainsi il découle de C) et D) que soit le principe de Lagrange est 
déjà démontré (Am — @), soit il existe un k, 0 < k  m, tel que 


Ar=@, Art Æ Ÿ. (9) 


E) Lemme 3. Si l’on a les relations (5), alors zéro est la solu- 
tion du problème de programmation linéaire suivant : 


(fa (@),2)—inf ; (fi (2), &) 0, 
i=k+1,...,m, F'(x) [x] =0. 


Démonstration. Supposons que n est un élément admis- 
sible pour le problème (6) (ie. tfi(x), D <0, i>k+1. 


F' (x) [nl = 0) tel que {fx (x), n) << 0. Soit 6 un élément de A,+,, 
ie. (fi (x), DD <O0,i>k+1, F'(x) [6] = 0. Alors, pour un 
e > 0O petit, l’élément n + eË appartient à À,, ce qui est en con- 
tradiction avec (5). 

F) Conclusion de la démonstration. Si l’on 
applique le théorème de Kuhn-Tucker (1.3.3) au problème (6), en 
prenant en considération le fait que la condition de Slater est vérifiée 
pour ce problème (4,+, étant non vide), nous pouvons trouver des 


(6) 
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nombres non négatifs es 3 À tels que le point zéro est la 
solution du problème 
m 

(É (&), æ) + 2, fi), 2 inf, Ft 0. (7) 


(Cette dernière assertion n’est autre que le principe du minimum 
pour le problème (6), le multiplicateur de Lagrange de la fonction- 
nelle étant pris égal à 1, puisque la condition de Slater est remplie.) 
Mais le problème (7) est justement le problème que l’on avait envi- 
sagé dans A). Le principe de Lagrange est donc valable pour ce pro- 
blème, ou, ce qui revient au même dans notre situation, on peut 


appliquer le lemme sur l’annulateur du noyau de l’opérateur F’ (x). 
Autrement dit, il existe un élément y* pour lequel 
m 


fe (+ >, À. f} (à) + (*oF") (@) = 0. 


Mais c’est là la condition de stationnarité de la fonction de 
Lagrange si l’on pose de Te — = —(); Àn — 1. EÆ 
Pendant la démonstration pour À, Æ @ il s’est avéré que Ào 1: 


Montrons que si F est régulière (i.e. Im (x) — Ÿ), aucune famille- 
de multiplicateurs de Lagrange vérifiant la condition de station- 
narité de la fonction de Lagrange ne peut contenir le multiplicateur 


À = 0. En effet, pour À,  @, il existe un élément h tel que 
F'(x),[k]—0,(f:(&), R}<0, i—1,...,m. 


Supposons maintenant que nous avons trouvé des multiplicateurs. 
de Lagrange À — (lu es Mo y* qui ne s’annulent pas simulta- 
nément et vérilient £+ (x, y*, À, 0)—0. Alors, d’après les inéga- 
lités À; (fi (x), h) 0, nous avons 


OL, (x, #", À, 0) [A] il hifi (æ), k)+ (y, EF’ (a) Le) = 
— 1 
et maintenant 
OZ, (x, y*, À, O)[x]=(y*, F'(x)[x]), Vr=imF'()ÆY, 


ce qui contredit l’hypothèse. 
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Enonçons tout ceci dans une proposition séparée. 
Proposition. Pour avoir Ào =Z Ô dans le théorème de 3.2.1, 


ilsuffit d'y ajouter l'hypothèse Im F (x) — Ÿ et de supposer qu'il existe 
un élément h € Ker F’ (x) pour lequel 


(lat); RO 11.2, M: 
Les hypothèses supplémentaires mentionnées ici seront appelées 
conditions de régularité forte du problème (1). 
Dans l'énoncé du principe de Lagrange que nous avons démontré 
(à part les conditions affirmant que les espaces sont des espaces de 
Banach et les fonctions sont différentiables) il n'y avait qu'une 
seule hypothèse, affirmant que l’image Im F’ (x) est fermée. Il faut 


remarquer que sans une hypothèse de ce genre le principe de La- 
grange serait faux. 

Tout d’abord, si l’on se passe de l'hypothèse de surjectivité de 
l'opérateur A € Z (X, Y) (X et Y étant des espaces de Banach), 
la formule (Ker A)! — Im A* peut s'avérer fausse, plus exacte- 
ment, il peut arriver que Im A* est un sous-espace propre de (Ker A)t. 
Par exemple, si 


D EE et 

Ne (00 ins ins re) 
on a Ker A — {0}, donc (Ker A)1 —7/,, tandis que Im À — 
— Im A* = /, (par exemple, l'élément y (14,072, 10m.) 


appartient à L,, mais l'équation Ax = y n’a évidemment pas de 
solution). Nous pouvons maintenant donner un exemple de pro- 
blème pour lequel le principe de Lagrange est faux. 

Exemple. Soient X et YŸ des espaces de Banach et supposons 
que l'opérateur A € Æ (X, Y) vérifie Ker A* — {0}, tandis que 
Im A* est un sous-espace propre de (Ker A)1. Ayant choisi xr* € 
€ (Ker A): Im A*, envisageons le problème 


{a*, æ)— inf; Az = 0. 

Pour ce problème, le principe de Lagrange est faux. En efiet, 
x =0 est un point de minimum et, si l'on pouvait trouver des Ào 
et y* E Y* tels que 
Lx (O, y*, ho) [k] = 0, VREX 

= hotr*, h)+4y*, Ah)=0, VREX, 

on aurait ho = 0 (car autrement x*EÏm A*) et par là même 
AY = 0 = y* = 0. 
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Exercicel). Soient Z=Y=1,, z2— (2, ...,2n, ...)€l, Az = 
= (2, 2/2, ..., an...) yéIMmA, X=RXZ, f(x) =f(a, 2) = a, 


F(x) = F(a, 2) = Az + y. 
Montrer que pour le problème f (x) —+ inf; F (x) = 0 le principe de La- 
grange est faux. 


$ 3.3*. Principe de Lagrange et dualité 
dans les problèmes de programmation convexe 


3.3.1. Théorème de Kuhn-Tucker (forme subdifférentielle). Le 
principe de Lagrange pour les problèmes de programmation convexe 
(le théorème de Kuhn-Tucker) a été démontré dans 1.3.3. Dans ce 
sous-paragraphe nous donnons la « forme subdifférentielle » de ce 
théorème et expliquons ses relations avec les autres notions d’ana- 
lyse convexe. 

Soient X et Ÿ des espaces de Banach, A: X — Y un opérateur 
linéaire continu, f;: X— KR, i—0,1,..., m, des fonctions 
convexes, a — (a, ..., 4m) € R7, bE Y, À, un ensemble convexe 
de X. Considérons le problème de programmation convexe suivant 


fox) inf; fi(t)<La, i—1,...,m, Ax—b, xE A. (3) 


L'ensemble {x | Âx — b} sera désigné par B. La fonction de La- 
grange pour le problème (3) est la fonction 


L (2, ÿ%, ke ho) = Dafo (+ D A (fe (a) — an +", Az—b). 


Proposition. Supposons que x est un point de minimum 


absolu pour le problème (3). Alors testun point de minimum absolu 
pour le problème élémentaire 


Ÿ (x) = max (fo (x) — fo (x), fa (&) — us + + + fm (&) — Am) + 
+ Ô (4 NB) (x) —+ inf, (3°) 
où Ô (AN B) est l’indicatrice de l’ensemble À N B. 
En effet, s’il existe un élément x pour lequel f(&)<0, cela signi- 
fie d’abord que x€ À, xEB (= Âx = b), et ensuite que f; (x) < 
<a;, i=1,...,m (ie. que zx est un élément admissible du 
problème) et enfin que fo (x) < fo (x) malgré l’hypothèse. 
Théorème (forme subdifférentielle du théorème 
de Kuhn-Tucker). Supposons que pour (3) les fonctions f;, i = 


1) Proposé par l'étudiant de 4-ième année V. Ouspenski. 
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— 0,1, ..., m, sont continues au point ze A N P, qui fournit un 
minimum absolu pour le problème. Alors on peut trouver des 


m 
nombres À,>0 tels que D) À —1,A;(f;(x)—a;)—0,i>1, et un 
i=0 
élément x* eo0(ANP) (x) de manière à avoir 
dE 2 À Ôf: (2) + 2*. (1) 
Démonstration. D’après l'hypothèse, x fournit un 
minimum absolu au problème élémentaire (3”). D’après le théo- 
rème 4 de 3.1.1, on a 0 € ôf (x). La fonction g (x) — max (fo (x) — 
— fo (x), f1 (x) — à, . . ., fm (4) — a») est convexe et continue 
au point rEANB (i.e. appartenant à dom Ô (À f\B)) et donc, 
d’après le théorème de Moreau-Rockafellar (voir 2.6.4), Ôf (x) = 
— Ôg (x) + 08 (A NB) (x). Enfin, d’après le théorème de Doubo- 
vitski-Milioutine (voir 2.6.4), on a 
ôg (a)= conv (6fi (x) U... U fi, (x), 
où les i; sont précisément ceux des indices pour lesquels f; (x) — 


Ai = g (x) — 0. Ainsi, on peut trouver deux éléments E* € 0g (x) et 
z* E08 (A NP) (x) pour lesquels 


E* + 240, Ë* € conv (ôfi, (x) U ... Uôfi, (x)) = Ê* = 
ny À n a Eôfi, (x), Ÿ À == 3 0: 
j=! j—1 J J 
Il ne reste qu’à poser À = O, iéf{is, ..., is}. 


Exercice. Soit B — {x| Ax = b}. Démontrer que x, € B implique 
68 (B) (xo) = (Ker A)+- 


Corollaire (principe de Lagrange pour 
le problème de programmation convexe à 
contraintes sous forme d'égalités et d'iné- 
galités). Dans les hypothèses du théorème, supposons que À = À 
et que l’image de X par l'application À est fermée dans Ÿ. Alors il 


existe des Dr à de Lagrange ho ER,ÀE R%, y* € YŸ tels que 
k>0, i>0, À (f: (&)—a;)=0, i>1, 
min Lx, *, À, lo)=£ (x, ÿ*, À, ho). (2) 
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En effet, si Im A est un sous-espace propre de Ÿ, on peut poser 
À, — ho =0, y* E (Im A)-. Si, par contre, Aest un opérateur sur- 


jectif, alors Où B (x) = (Ker A) —=Im A*. Par conséquent, d’après 
(1), on a 


m 
DEGE (x, %, À ho = D :0f: ()-+ Im A* 
i=0 
et donc, par définition de la sous-différentielle, 
L (x, y*, à, lo) —£ (x, y*, à, Ào) — (0, x— x) >0 
= Lay, ho) > Lx, y, À, À), Vr. 
3.3.2. Méthode des perturbations et théorème de dualité. Dans le 
sous-paragraphe précédent, le problème de programmation con- 
vexe (3) a été considéré comme un seul problème individuel. De 
plusieurs points de vue, il est naturel et efficace de considérer des 


familles entières de problèmes de ce genre. Ayant fixé f;, À, a;, 
A et b, nous pouvons inclure le problème (3) dans la famille 


Joints HO + d, L=1,.::,m, 
At +n—=b, zxEA. (3(«, n)). 


(II va de soi que l’on aurait pu simplement supposer que a; et b 
sont des paramètres variables de la famille, mais ayant introduit 
les paramètres «;, n de la manière indiquée ci-dessus, nous obtenons 
des formules plus élégantes.) L'ensemble des problèmes {(3 (&«, n))} 
est appelé perturbation du problème (3) = (3 (0, O)). 

Nous avons déjà vu dans 3.3.1 que le problème (3) se réduit 
à un problème élémentaire. Maintenant nous ferons de même pour 


la famille 3 (4, n), mais d’une façon un peu différente. À savoir, 

désignons 

fo(x) si fix) +a; <Ka;, Ax+n—b, xE À, 

fa, 1) = (1) 
+ co dans les autres cas. 


Alors la famille (3 (4, n)) peut s’écrire sous forme de problème élé- 
mentaire 


f(x; à, n)— inf (par rapport à x € X). (2) 
Par la suite, lorsqu'il s'agira du problème (3 (4, )), nous ne 


distinguerons pas son énoncé original de l’énoncé (2). Pour les 
contraintes indiquées, la valeur de ce problème, i.e. inf f,, est une 


fonction de & — (&;, ..., äm) et n; cette fonction sera désignée 
par $, S: R® X Y = KR et sera parfois appelée S-fonction: 
S (a, m=inff(ca, 1) inf f(#. (3) 
X 


xEAÀ, J;(x)+a;<a;, Ax+1n—b 
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Lemme. Supposons que F (x, z) est une fonction convexe sur 
le produit des espaces vectoriels X et Z. Alors la fonction 


S (2) — inf F (x, 2) 


est convexe sur Z. 
Démonstration. Soient (z;,t;) EepiS, i — 1,2, et 
À E [0, 11. Alors S (z;) <t;, i — 1, 2, et pour tout e > 0 il existe 
des (x;, z;) tels que F'(x;, z;) t;, + &, i = 1, 2. D'où, F étant 
convexe, 
F (has + (1 — À) a, Mn + (1 — À) 2) & 
LAF (ts, 21) + ( — À) F (xs, 22) < 
LA +e)+AH—-dD (bi +e)=M +(—Àt+e. 
Le nombre € = 0 étant arbitraire, on a 
FO +(A— dar, A1 +(1—-)À)2) < 
LM +(U—-hésS (a + (1 — À) 2) < 
LA (A—dt= (Az + (A —À)z, At + (—NÉ)E 
Eepi S. M 
Proposition 1. Soient X et Y des espaces vectoriels, À C X 
un ensemble convexe, A: X —+ Y une application linéaire. 
Si les fonctions f;: X—R, i — 0, 1, ..., m, sont convexes, 
alors la fonction f (x; «, n) définie par l'égalité (1) est convexe sur 


NOCRECT: 
Démonstration. Les ensembles 


Mo = {(: a, nm, t{)|[(x t)€ epi fo} 

M; = {(&, à, n, t) | fi (x) + œi Kai}, 

MA = {(x, à, n, t) |z € A}, 

Mn = {(x, a, nn, t)| Ax + n = b} 
sont convexes dans X X R® X Y X R. En effet, on a (en modifiant 
parfois l’ordre des facteurs pour simplifier) 
M, =epifo XR®TXY, MAa=AXRXYXR, 

Ma=Ât1(b)XR XR, 


où À: (x, y)r> Ar + y est une application linéaire de X X Y 
dans ÿ et 

M, = cepi ff; —a;} X R°TIXYXR, 
où Oo: (x, t)r> (x, —t) est la symétrie dans X X R. D'où l'on 
voit que tous ces ensembles sont convexes et il ne reste qu'à remar- 
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quer que 
epif= NM; NN MAN M\. | 
i=0 


Corollaire 1. La S-fonction du problème (3 (œ, n)) est 
convexe sur R7 X Y. 

Dans le $ 2.6, nous avons déjà vu que la convexité permet de 
faire correspondre à divers objets (les fonctions, les ensembles) des 
objets duaux dans l’espace dual. Maïs la même chose est vraie pour 
les problèmes de programmation convexe. Nous supposerons par 
la suite que X et Y sont des espaces localement convexes, X* et Y* 
les espaces duaux correspondants, À = (À,, ..., Àm) € RT*. 

Définition 1. La famille des problèmes d’extrémum 


g(x*; À, n*)— sup (par rapport à À € R7*,n* EX), (3* (x*)) 


où (—1)g (xt; À, n*) = f* (x*; À, n*) est la transformée de 

Young-Fenchel (voir 2.6.3) de la fonction (x, &, nn) f(x, «&, n) 

dèfinie par l'égalité (1), est dite duale de la famille 3 (æ, n) <=: (2). 
Le problème 3* — 3* (0) est appelé dual du problème 3 — 

— 3 (0, 0) (relativement à la famille des perturbations 3 («, ")). 
La solution du problème 3* (x*) sera désignée par 


D'(z*)= sup g(x*; À, n*). (4) 
(À, n*) 


Puisque la fonction f* est convexe, la fonction de signe con- 
traire g est concave. On aurait pu appeler les problèmes duaux 
problèmes de programmation concave, maïs nous préférons de nous 
passer d’un nouveau terme. 

Définition 2. On appelle fonction de Lagrange d’une 
paire de familles 3 («, B) et 3* (x*), ou fonction de Lagrange élargie 
du problème (3), la fonction £: X X RT* X Y*—R définie 
par les relations 


| fo (+ 2 À; (f:(x)—a;)+(n*, Axz—b), 
Lx, nm) = À (7€ À, ACER), (9) 
rs (xE À, 1GÇR%), 
+, (xé À). 
Lorsque (À, n*) sont fixes, cette fonction est convexe relative- 


ment à x, et lorsque x est fixe, la fonction de signe contraire, —%, 
est convexe relativement à (À, n*). 
Notons que 


Pt 


Lx; A, n*) = Lx, n*, À, 1), zxeEA, À ART, (6) 
où £ est la fonction de Lagrange du problème (3), définie dans 3.3.1. 
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Proposition 2. Une paire de familles duales 3 (a, n) 
et 3* (x*) est bien définie par leur fonction de Lagrange, puisque 
f (x; à, n) Sue ES £)*®, g (x*; À, n*)= — +, (7) 


Où «(1) ef x(2) désignent les transformations de Young-Fenchel rela- 
livement aux variables x et (À, n*) respectivement. 


Démonstration. D'après la définition de la transfor- 
mation de Young-Fenchel 


82, nf) = GS, nf) = 


re {{r*, t)+la+(n*, n)—f(x; À, n)} = 
= sup {(x*, z)+la+(n*, n—f(x)}= 


XEA, Ax+n—=b 


at ({a*, æ) —fo @— 2 (fi (x) —a;)—(n*, Ax—b),] 
x Îi= … 
À ER", : 
+ oo, ÀËR®* 
= HD (et;h, n° 
ce qui démontre la deuxième des égalités (7). En passant, nous avons 
obtenu la relation utile suivante 
inf (£ (xt; À, n*)—(z*, x)), À ER", 
£ (x: À: n*) es RCA (3) 
— oo, ÀéRr. 
D'autre part!), 


(0% — sup (ha + (mn, m + (x À, n*)) -- 


+ oo, xé À, 
un (Aa + (n*, 10) + fo (x) + 


| 
_ JA 
À 
| +È (a +(n*, Az— 0) 
+ oo, sit AouAr—-b=Æ—mouf;(x)—a; > —a«; 
— pour un certaini, . 
fo (x) dans les autres cas 


=f(tan). M 


1) De même que dans 2.6.3, en calculant la fonction adjointe d’une fonc- 
tion définie sur l’espace dual (dans notre cas RM* X Y*), nous convenons que 
le résultat est une fonction sur l’espace donné et non sur le deuxième espace 
dual. 
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Corollaire 2. La fonction duale de la S-fonction du pro- 
blème 3 («, n) est de la forme 


— inf £ (x, n*, à, 1), ÀAERPE, 
os À, #)= — 0; À, he Fes 9 
(Q, n°) g( n*) LE ne (9) 
Démonstration. Par définition 
S* (A, n*)= sup (a+(n*, n)—inff(x;a, n))= 


(œ, n) 


= sup, Qa+(nt, m)—f (a a, n))= —28(0; à, n*), 
&, 1, x 


d’où l’on voit que (9) découle de (6) et (8). 
Ainsi le problème 3* — 3* (0), dual du problème 3 — 
== 3 (0, OÜ), peut encore être énoncé sous la forme suivante 


—S*% (à, n*) = inf Z£ (x, n*, À, 1) — sup; 10 


Remarque. La définition du problème dual dépend en 
général du choix de la famille de perturbations dans laquelle nous 
avons inclu le problème donné (3). Les égalités (5) et (6) (qui déter- 
minent la fonction de Lagrange élargie) et les égalités (7) montrent 
toutefois que les familles {(3 («, n))} et {(3* (x*))} correspondent 
dans un certain sens naturellement au problème (3), de sorte que 


le problème (3*), équivalent à (10), est son problème dual dans le 
même sens naturel. 


Exercice. Montrer que si les fonctions f;, et l’ensemble À sont convexes 

et, fermés et si f, (x) ne prend pas la valeur — sur l’ensemble des x admissibles 
our le problème (3), alors la famille duale (si l’on prend en considération 
a note au bas de la page dans la démonstration de la proposition 2) de la famille 


{(3* (x*))} coïncide avec {(3(&«, n))}, de sorte que les problèmes (3) et (3*) 
forment une paire de problèmes duaux entre eux. 


Théorème de dualité pour les problèmes 
de programmation convexe. Supposons que la S-fonc- 
tion de la famille {(3 (&œ, n))} est continue au point (0, 0). À lors, 
quels que soient (a, ) € int (dom S), 

Sa, n)= sup (Aa+(n*, n)+ inf £ (x, n*, À, 1)). (11) 
,n*EY* xEA 


À1>0 


Les valeurs du problème (3) et du problème dual(3*) sont égales 
entre elles: 
ini f(x) =S (0, 0) = E (0) = 
xE.A 


Ax=—b 
f,(x)<a;, ii, ss M 


= SUP linf dr +2 hf: (x) —a;)+(n*, Ax—b)}}. (12) 
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Démonstration. D'après le corollaire 1, la fonction $ 
est convexe, et il découle de sa continuité en un point (proposition 3, 
2.6.2) qu'elle est continue et qu'on a l'égalité S (œ, n) — 
— (conv S) (x, n) pour tous les (x, n) € int (dom S). D'après le 
théorème de Fenchel-Moreau (voir 2.6.3) et le corollaire 2, on a 


Sa, m)=S%*(a, n)= sup Ga+én*, n—5% 0, n°) = 
, n* 
= sup (Aa+(n*, n)+infZ (x, n*, À, 1), 


n*EY* 


ce qui démontre (11). En substituant & — 0, n — 0, on obtient 
(12). 
Corollaire 3 (théorème du minimax). Dans 
les hypothèses du théorème de dualité, on a la relation 
sup inf £ (x, n*, À, {)=inf sup £ (x, n*, À, 1). (13) 
À>0 xEA xEA ÀZ0 
n*EY * n*Ex * 
Démonstration. Le premier membre de (13) est égal 
à À (0) et coïncide donc, d’après (12), avec S (0, 0). En ce qui con- 
cerne le deuxième membre, on a 
inf sup Z(x, n*, À, 1)=inf sup Z (x; À, n*) = 


xEA LE XEA (À, n*) 


= inf ((—£)*® (x;0, 0))=inf /(x;0, 0) 
xEA xEA. 


d’après (7), et il coïncide également avec $S (0, O). 


3.3.3. Programmation linéaire : théorème d’existence et théorème 
de dualité. Soient: X un espace vectoriel, X” l’espace qui lui est 
algébriquement dual (ï.e. l’ensemble de toutes les fonctionnelles liné- 
aires sur À), ÆÀ un cône polyédral (i.e. l'intersection d’un nombre 
fini de demi-espaces 


Hi Led mer art 38) 
quoique parfois la condition de polyédralité s’avère superflue). 
Les problèmes d’extrémum de la forme 


(Les x) —- inf ; Î: (x) —= (Ti, x) > 0;, = 1, .. . M, 


zEK, (1) 


constituent la classe bien déterminée de problèmes de programmation 
linéaire. 

Dans ce sous-paragraphe, nous allons considérer le cas de dimension 
finie, où X = R', X’ = R'*, À — R?7. Dans ce cas, le problème 


$ 3.3*] DUALITÉ DANS LES PROBLÈMES DE PROGRAMMATION CONVEXE 259 


(1) peut être récrit de la manière suivante 
cx— inf; Ax>b, x>0, (2) 


où cER"#, A =(a),j=1,...,n, i=1,...,m, est la ma- 
trice qui détermine l’opérateur linéaire de R” dans R7, b € R7. 
Le symbole z° > z pour des vecteurs de dimension finie z° et z si- 
gnifie que toutes les coordonnées du vecteur z sont inférieures ou 
égales. aux coordonnées du vecteur z’. Le problème (2) est appelé 
problème de programmation linéaire de dimension finie. Ce problème 
est un cas particulier du problème général de programmation con- 
vexe. En outre, il possède une structure encore plus spéciale : toutes 
les fonctions considérées sont ici linéaires et le cône est polyédral. Comme 
toujours, nous conviendrons que si le problème (2) est incompatible, 
i.e. ne possède pas d’éléments admissibles, sa valeur sera considérée 
égale à +00. 

Théorème d'existence. Si l’ensemble des valeurs admis- 
sibles du problème de programmation linéaire de dimension finie (2) 
est non vide et sa valeur est finie, alors le problème possède une solution. 

La démonstration du théorème 1 se base sur un fait 
de géométrie de dimension finie assez simple. Rappelons que l’en- 
ieOPe conique cone C d’un ensemble € & X est définie par l’éga- 

ité 


coneC={xeX|xz— D Aix, 120, x,€C); 
1 


c'est un ensemble convexe (voir proposition 2, 2.6.4). 
Nous dirons que le cône cone C est engendré par l’ensemble C. 
A) Lemme sur le cône dans un espace de 
dimension finie engendré par un nombre 
fini de points. Tout cône dans un espace de dimension finie, 
engendré par un nombre fini de points, est fermé. 
Démonstration. Supposons que 


K=cone CCR", C—H{,...,2}, 2 ER, 


la démonstration sera effectuée par récurrence. 

1) k = 1. Alors À = cone {z,} = {x | x — Az, À > 0} est une 
demi-droite, ï.e. un ensemble fermé. 

2) Supp:sons maintenant que le lemme est vérifié pour k — 
= $ — {. Démontrons-le pour 4 — s. Deux cas sont possibles: 

a) Le cône Æ contient les vecteurs —z2,, . . ., —z,; alors X est 
un sous-espace d’un espace de dimension finie et, par conséquent, 
un sous-ensemble fermé ; 





1) Rappelons que pour les espaces de dimension finie nous avons deux 
notations: 


ñn 
{c, 2x)=cz= City, CERF, zCRA. 


i—1 


17% 
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b) au moins un des vecteurs (—z;), i = 1, ..., s, par exem- 
ple (—z,) n’appartient pas au cône Æ. Désignons par X,; le cône 
cone {Z1, « « ., 2-1}. D'après l’hypothèse de récurrence, le cône X, 
est fermé. Supposons que le vecteur z appartient à l’adhérence du 
eône Æ, ie. z = lim &,: 4, EX, n>1. Par définition, 

n 


En EK=cone{z4, ..., 26} > En — 2 hinzi = On + hsn£s: 


Ga € K'; et Nen Z>0. 
Si l’on suppose que Às,n —> 0 quand n—+, alors 


_7,=lim En—Ën — Jim En ex, 


n— 00 sn ñn — 00 sn 





(rappelons que ë, — z et donc E,/Àsn — 0, tandis que &,/À,, appar- 
tient à À, en même temps que 6,), i.e. —z, € K, vu que K, est fermé, 
ce qui contredit l'hypothèse. Donc À,, ne tend pas vers l'infini et 
l’on peut choisir une sous-suite Âsn,, qui converge vers un certain 
nombre 4,9 > 0. Dans ce cas 


Cry, = Eny D. hsnyZs + 2 — dot = 2. 


K, étant fermé, le vecteur z appartient à K,, donc 
2 = 2 + 0, € K. El 


B) Démontrons maintenant le théorème d'existence. 

Considérons dans l’espace R7*1 l’ensemble X constitué des vec- 
teurs (æ&, 2), a € R, 2€ R7 pour chacun desquels il existe au moins 
un vecteur x € R? vérifiant cr < «à, AT > 2. 

L'ensemble K est un cône, car si (@, z z) € k. on à, pour un certain 
x € R?, la relation <a, Az >z. Mais alors pour tout t > 0, 
on à " E R’,c (tr) Lta, À (tx) > 12, ie, t (a, 2) E K. 

Montrons que le cône Æ est engendré par un nombre fini de vec- 
teurs de R7#+1: 


Cr 7 (C1, ya ee: Ami); Co De (Co, os + +. Am2); se 
= (cn, less dr) 
Cn+1 = (1, D, s20) rés (0 et 0 ss 0e 
> Cntm+1 = (0, no eh) 


Tout d’abord &, € K, de sorte que cone £{6:, . .., Cn+m+1} € À. En 
effet, si À Lin, on peut choisir en guise de x le vecteur de base 
standard e; ; pour les autres i, il faut prendre x = 0. Supposons main- 
tenant que le vecteur Ë — (x, z) = (@, 21, . .., 2m) appartient 
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K. Alors, pour un certain x € R7, x = (x,, ..., æn) tel que x, > 
0, 


à 
> ., 4 > 0 et des nombres $, > 0, $; > 0 on a les relations 


n 
2 ct +Bo— a, > dit; —P;=2;, L = 1: ss.) M. 
J= J= 


Mais cela signifie justement que 


n 


C—(a, z)=— 2 Lib j + Bobn+1 + à Piên+itts 


2= 


t, 20, BoZ>0, B:Z0 


CÉcone {Gi 42 Canne 


D'après le lemme du sous-paragraphe précédent, le cône Æ est 
fermé. D'après les hypothèses du théorème, le problème (2) possède 


l'élément admissible x et prend la valeur a > — —oo. D'après la 
définition de Æ, on voit que le _ point (&, b), où a —cx, appartient 
À . Il est alors évident que « > &. Par conséquent, l’ensemble 

— {«ER|(«, b)E K} est non vide et a — inf {a |a EX}, 
pe 4e b) appartient à l’adhérence du cône Æ et donc à X lui-même. 
Il existe donc un élément x > 0 pour lequel Ar > bete <a — 


= cx — «à, i.e. x est la solution du problème. 


Passons à l’étude du problème dual. Le théorème de dualité 


prend ici une forme plus achevée que dans le sous-paragraphe précé- 
dent, puisque en vertu de la structure spéciale du problème sa S-fonc- 
tion est fermée. 

D'après les formules (5) et (6) de 3.3.2, la fonction de Lagrange 
élargie est de la forme 


cx+A(b—Ax), xERT, ACR?*, 
L (x: À) — 7 09 x E R?, AR, 
+ oo, xé R?. 


Naintenant nous pouvons trouver la famille des perturbations du 
problème (2) et la famille duale. D'après (7) de 3.3.2 


f(x 0)=(— 2) ® = sup (ha +Z (x, A) 


+ oo, zéR?, 
= Sup (AG re ADS AR), xzER?T— 
20 


cx, x>x0, Ax>xb+a, 
_ [| + dans les autres cas. 
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En désignant z — b + «, nous obtiendrons la perturbation du pro- 


blème (2) 
cx— ini, x>0, Ax>z. (3) 


D'une manière analogue, pour définir le problème dual, nous devons 
calculer 


g(0, A =(—Z*4)(0, à) = —sup(—Z (x, 1))— 


—sup(—cx—1(b—Ax)), 120, 
Æ MER, 
Ab, ÀAZ>0, AA4<c, 
= | — oo dans les autres cas. 
Ceci nous donne le problème 
Ab — sup; AA<c, À>0, (4) 


dual du problème (2). Il possède la même structure que le problème 
(2) et l’on voit facilement que si l’on prend pour point de départ 
le problème (4) et construit le problème dual par la même méthode 
qui a permis d'obtenir le problème (4) à partir du problème (2), 
nous obtiendrons à nouveau le problème (2). C'est pourquoi on peut 
parler d'une paire de problèmes duaux de programmation linéaire. 

Théorème de dualité. Pour une paire de problèmes 
duaux de programmation linéaire on a l'alternative suivante: ou bien 
les valeurs des problèmes sont finies et égales entre elles et les deux pro- 
blèmes possèdent une solution, ou bien dans un des problèmes l’ensemble 
des éléments admissibles est vide. 

Dans le premier cas, x ER? et À ER"* seront les solutions des 
problèmes (2) et (4) respectivement si et seulement si ces valeurs sont 
admissibles pour ces problèmes et vérifient une des deux relations 


CT — Âb, (5) 
À (Az—b)=(ÀAA—c) x. (G) 


Dans le second cas, un des problèmes est incompatible et l'autre est 
soit incompatible (i.e. son ensemble d'éléments admissibles est vide), 
soit prend une valeur infinie. 

Démonstration. A) Construction de la 
Sfonction. Considérons à nouveau le même cône À que dans 
la démonstration du théorème d'existence. Si (œ, 2) € K et f > «, 
alors (B, z) € À et donc Æ est l’épigraphe de la fonction 


S (2) = inf {a | (x, z) € K}. (7) 
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Il découle de la démonstration du théorème d’existence que inf est 
atteint et S (z) est la valeur du problème (3), de sorte que la for- 
mule (7) détermine la S-fonction du problème (2). Puisque X est 
un cône fermé et convexe, la S-fonction du problème (2) est fermée 


et convexe. 
B) Calculons la fonction S* duale de la fonction S. Par défini- 


tion, 
SX (À) — 
= sup(Az—S(z})—sup{az—inf{cr|xER?, Ar>z}h — 
— sup{az—cr|xER?, 2CR%, z<Ax}. 
(z, x) 


Il est évident que sup {z [26€ R", z< Ar} = ÀAx < oo, si et 
seulement si À > (0. 


Ainsi, 
sup(ÀiA—c)x, si ÀACRTE, 
+ oo, si AG RT* 


0, si AAC, ÀAZ>0, 
nr dans les autres cas. 


Par conséquent, 
SY% (z) = sup {Az [AA LC, À > 0}. (8) 


En particulier, on voit que S** (b) est la valeur du problème 
dual (4). 

C) Conclusion de la démonstration. La fonc- 
tion $ ne peut être identiquement égale à oo, car $S (0) < 0, 
puisque zéro est un élément admissible du problème cx—- inf, 
Ax 0, x > 0; par conséquent, dom S = G. 

Un des deux cas suivants est possible : 

1) S (2) > —o, Vz ou 

2) il existe un z pour lequel S (2) = —00. 

Le cas 1) se subdivise à son tour en deux: 1a) b € dom S et 
1b) b é dom S. Dans le cas 1a), S est une fonction propre et la valeur 
du problème est finie. Puisque S est fermée (d’après le théorème 
de Fenchel-Moreau, voir 2.6.3), on a S** (b) — S (b) et il découle 
maintenant de (8) que le problème dual (4) prend la même valeur 
que le problème direct (2); il est donc, en particulier, compatible. 
D'après le théorème d'existence, la solution existe pour les deux 
problèmes. Dans le cas 1b), on a S (b) — +, i.e. le problème (2) 
est incompatible. Appliquant à nouveau le théorème de Fenchel- 
Moreau, on obtient S** (b) — $S (b) et l’on voit donc que le pro- 
blème (4) est compatible, alors que sa valeur est infinie. 
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Dans le cas 2), on a S (2) = —o pour tous les z € dom S (voir 
l'exercice 8 de 2.6.2). Par définition, S*Y (À) = oc et :SY* (z) = 
= —o. En particulier, S** (b) — —o, i.e. le problème (4) est 
incompatible. 

Si b € dom S$, alors le problème (2) est compatible et sa valeur 
est infinie: $ (b) — —o. Si par contre b & dom $, alors S (b) — 
— —+oo, le problème (2) est incompatible. L’alternative est entière- 
ment fondée. 

Revenons maintenant au cas Îa). Comme nous l'avons déjà 
démontré, les solutions des problèmes (2) et (4) existent dans ce cas. 
Désignons-les par x et À respectivement. Il a été démontré que les 


valeurs du problème sont cx — Àb, i.e. on a (5) et donc 
À (Az —b)= À Az — b= NAT —cx—(ÀA—c)x, 
i.e. on à (6). En outre, si x et À sont des éléments admissibles 
(i.e. 20, 120, A4<c, Ax>b), alors 
cx > A Az > 0. 


Par conséquent, cz = Àb implique que x et À sont des solutions 
du problème. En outre, si À (Az—b)=(ÀA—c)x, on a cz = Àb, 


i.e. x et À sont les solutions du problème. 


Ainsi, si x et À sont des solutions, on a (9) et (6); si x et À sont 


admissibles et on a soit (5), soit (6), alors x et à sont les solu- 
tions du problème. Le théorème est entièrement démontré. 


Exercice. Que devient dans la situation considérée le théorème du 
minimax (corollaire 3 de 3.3.2)? 


3.3.4. Théorème de dualité pour le problème de la plus courte 
distance. Lemme de Hoffmann et lemme du minimax. Soient : Y un 
espace normé, B € Ÿ un sous-ensemble non vide de Y. L'expression 


Sp (n)=E6 (n, FI (1) 


est appelée distance du point n à l’ensemble B. L'étude de la fonction 
S& (n) est une des questions principales de la théorie des approxi- 
mations (voir [111]). Si B est un ensemble convexe, nous obtenons 
le problème de programmation convexe. Le théorème de dualité 
démontré ci-dessous possède de nombreuses applications en analyse. 

Ainsi, supposons que B est un ensemble convexe. (Par la suite, 
cet ensemble est fixé, et nous omettons l'indice B dans la notation 
de la fonction S.) Alors la fonction n+- $ (n) est une S-fonction du 
problème suivant 


Nzl— inf; y—z=n yeb. (2) 
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Amenons (2) à la forme standard d’une famille de problèmes de 
programmation convexe (voir (3(œ, n)) de 3.3.2). Pour cela, posons 
À =YX Y,x= (y, 2), fo (x) = 2, Ax=z—y, A: X — Y, 
A = {x = (y, 2) | y € B}, alors (2) se met sous la forme 

fo(æt)— inf; Ax+n—=0, xedA. (3) 

Il découle de ce que nous venons de dire que la fonction $ est. 
convexe (voir le corollaire 1 de 3.3.2). 

Par la suite, nous nous servirons de la notion géométrique impor- 
tante suivante. 

Définition. On appelle fonction d'appui de l'ensemble 
B &Y la fonction sB: Y*— KR définie par l'égalité 


SB (y*) = sup (y*, y). 
yEB 


Théorème de dualité pour le problème 
de la plus courte distance. L'expression S (n) peut 
‘tre représentée sous la forme duale suivante 


S (n) = p (n, B) = sup {{y*, n) — sB (*) 1 y* IL} (à) 


Démonstration. Il est évident que S(n) >0, Vn. 
D'autre part S (n) < || yo — N ||, où y, est un point quelconque de B. 
On voit donc que S$ est une fonction bornée et, par conséquent, elle 
est continue partout sur Ÿ (proposition 3 de 2.6.2). Maintenant 
nous pouvons appliquer le théorère de dualité de 3.3.2. Puisqu'il 
n’y a pas d'’inégalités dans (2), la fonction de Lagrange est de la 
forme 


L(x, ds 1) = Il z I + (ur Z — y}. 
I1 découle de la formule (11) de 3.3.2 que 


S (n)= sup ((y*, n)+inf(llzil+{(y*, z—y))) — 
a vEY 
= sup{((y*, n)—sup(y*, y))—sup((—y*, z)—||z|} = 
y* vEB zEY 


= sup {(y*, n)—sB (y*)— NY (—y*)}, 
y* 


où V (2) = ||z||, tandis que N* (z) = 0 pour {| z* [| L'1 et +oo 
pour |[z* [| > 1 (proposition 3 de 2.6.3). Ceci implique (4). Æ 
Par la suite, nous aurons besoin de la généralisation suivante du 
corollaire 2 de 2.6.4. 
Lemme sur le cône dual. Soient X et Ÿ des espaces 
de Banach, À: X — Y un opérateur linéaire surjectif de X dans Ÿ, 
21, ..…, 2* ces éléments de l’espace dual X* et supposons que 


K = {r|{Ë,x)<&0, i=1,...,s, Ax = 0} 


est un cône dans À. 
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Alors chaque élément 15 du cône dual 
KP rl Gr, =0, ZCK) 


se met sous la forme 
# 
+ * 
ai = D hat + A 
i—= 


pour certains À; > 0 et y* E Y*. 
S 
Démonstration. A) Désignons L = f Kerzï, Z = 


i—=0 

— Ker AL, et soit x: Ker À — Z la projection naturelle qui appli- 
que x € Ker À dans la classe x (x) € Z qui le contient. Montrons que 
dim Z <s + 1. En effet, soient .z,, . .., z,+, des éléments quel- 
conques de Z, z;, — x (x;). Le système de s + 1 équations linéaires 
homogènes 

s+1 s+1 

2 (ti, tj) Aj= (a? 2 x) =0, ES 0 RS PE 2 
à s+2 variables possède une solution non nulle À,, ..., Às+44. 
Alors 
" s+1 | À ñ 
LT > At; EKerzi, i=0, ...,s, =xEeL=æ0=nx(x) = 


3=0 
s+1 L s+1 t 
à 
= D An(z)= 2 À;z;. 
3=0 3=0 


Par conséquent, tout ensemble de s + 2 éléments de Z est une famille 
linéairement dépendante et d = dimZ<s<+ fi. 

B) Choisissons dans Z une base f,, ..., f, et établissons l’iso- 
morphisme standard entre Z et R° et entre Z* et R‘%* 


d 
2 Cilir (Qu .. Ca); 


d 
42", Z) = 2) (ar, Ï 5) Ca; ie 
1—= 
> 2% ([, es Ca) = ({2*, fa): F9 (2: fa). 
Ensuite, définissons les fonctionnelles 2Ÿ € Z*Y, i — 0, 1, ...,5, 
en posant 


(25, n'(x)) = (af, x) 


et considérons dans Z* le cône convexe 


Le. 4 


K=cone{z*, ..., 2#}—{z*| D A;zt, A,>0). 
i=1 
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Puisque Z* est de dimension finie, tandis que le cône Æ est engendré 


par un nombre fini de points, À est aussi un ensemble fermé d’après 
le lemme de 3.3.3. 


Supposons que —25 é K. Alors, d’après le deuxième théorème 
de séparabilité (voir 2.1.4), il existe une fonctionnelle linéaire 


1E (Z*)* qui sépare strictement {—z5} et À 
, —29)>> sup {({, z*) | z* EK}= sup (2 A, G, 2) ]4,>0}. 


Mais alors on a nécessairement (/, zj) < 0 (autrement sup = +), 
— sup.{(1, z*) |z* € Khet (l, 26) < 0. 
Remarquons maintenant que /, comme toute fonctionnelle linéaire 
sur un espace de dimension finie Z*, est donnée par une forme linéaire 
d d 


d 
2e D'aitt= ac, Jp, À'afn (À, à). 


i—=1 i1=1 
d 


En choisissant dans la classe a = > a;f;eZ—Ker A/L un re- 
=! 


1—= 
présentant t EKer A, a=nr(x,), nous avons, d’une part, 
(té, 20) = (2, à (xo)) = GË, a) = (, 2) K 0, 
par conséquent, 


mEKerAN 1 {xl (at, D <0}=E. 
i—1 


D'autre part, 
(Tô: To) — (20 T (to) ) += (20: a) Te (£, 20) < 0 


et, par conséquent, 25 € K*, ce qui contredit l’hypothèse du lemme. 


Ainsi la supposition que —z$ à À nous amène à une contradic- 
S 
tion, donc —z*— D À,z* pour certains À, >0. 
i=1 


C) Quel que soit xEKer À, on a 
(+ D Art, a) (28 + D Az, n(x))=0. 
=! {= 


S 
Donc er À;xi appartient à (Ker A)! et, d’après le lemme sur 
{=1 
le noyau d’un opérateur régulier (voir 2.1.7), on à 
S 
to + 2 hiri = A%(—y*) 
1—= 


pour un certain point y*E Y*. M 
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Lemme de Hoffmann. Supposons que les hypothèses du 
lemme sur le cône dual sont remplies. 
À lors, pour la fonction de distance d'un point x à K on a l'inégalité 


p(x, K)<C (2 (xt, x) + Ac] |, (5) 


où (xŸ, x)+ est égal à (x*, x) lorsque (af, x) > 0 et s'annule dans 
les autres cas, tandis que la constante C ne dépend pas de x. 

Démonstration. L'ensemble X, étant l'intersection d’un 
nombre fini de demi-espaces et d’un sous-espace, est un cône convexe 
de X. Calculons sa fonction d’appui sX. Soit x* € X*. Un des deux 
cas suivants est possible : ou bien il existe un élément x, € K tel que 
{t*, zoo) 0, ou bien (x*, x) < 0, Vx E K. Dans le premier cas 
SK (x*) > t (x*, to), VIE R:, donc sX (x*) — +oo. 

Dans le deuxième cas (—1) x* appartient au cône dual du cône X 
et donc, en vertu du lemme précédent, 


s 
LP == 3) Ati + Ay*, À,>0, PPÉVE 
i—=1 
Ainsi 


| | % NT r* % 
FU Ed NS LS 
. + co dans les autres cas. 


En appliquant maintenant la formule (4) (théorème de dualité} 
à notre problème, nous obtenons 


p(x, A)= 
= sup {(2*, [at D Aaf+A%yS, 21,20, [la*[I&1}. (6) 
==] 


Le sous-espace L = lin {x*, ..., x} + Im A* est la somme du 
sous-espace fermé Z, — Im A* (car Im A* = (Ker A)! et un annu- 
lateur est toujours fermé) et du sous-espace de dimension finie L, = 
— {x1, ..., x*}. Alors ZL sera fermé dans X (démontrez-lel) et 
c’est donc un espace de Banach. L'opérateur 


S 
Au RXY*— LL, Ai, y)= D Asa + AY 
1 
est linéaire, continu et applique R° X Y* sur l’espace de Banach L. 
D'après le lemme sur l'application inverse à droite (voir 2.1.5), 
il existe une application M,: L— R° X Y* telle que À, ° M, — 
= Li, 1 Ma | CI zx* | Alors, si [2* [<1, on a 


S 
I Ma* rss 2 HI IIKC: 
= 
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Ainsi, dans l’expression (6) on peut supposer que 0<A,<C, 
Hy* IC, d’où l’on obtient 


S(x)=p(x, A)< 


<sup{( D Met+ At, 2 10 MC, [ut ISCS 
i— 


<C{2 Qt, 4 +1] Az |f}. 


Remarquons que si le cône X est donné seulement par les égalités 
K = {x |({x*f, x) = 0, Ax = 0} 
{i.e. est un sous-espace), il possède une définition à l’aide d’iné- 
galités 
K = {xr| (af, x) 0, ((—1)af, x) O0, Az = 0}. 


En appliquant le lemme de Hoffmann, nous obtenons dans ce cas 
pt, HECIT lt, o1+ AZI. (5°) 


Lemme du minima x. Soient X et Ÿ des espaces de Ba- 
nach, A: X — Y un opérateur surjectif, af EX, i=1,...,s, 
a = (a, ..., a). Déjinissons la fonction S: R° X Ÿ — KR en posant 

S(a, y)= inf max (a+(af, 2). (7) 
Ax+y=0 1<i<s 


Simax (x, æ)>0 pour tout xE Ker À, on a la formule de 
1<LÎi<s 
dualité suivante 


S (a, y)=sup {Z œa; +, pla 20, 
ai, Afy*+ 2 axi=0}. (8) 
i=1 


En outre, inf dans (1) est atteint pour un certain x = x (a, y) 
{pas nécessairement unique) et il existe des C > 0, C =.0, qui ne dépen- 
dent pas de a, y, tels que pour un choix approprié de x (a, y) on a 


It (a, DISCHIS (Aa DI+lal+ y} < 
<C(Ial+ y)  (@) 


Démonstration. L'existence du minimum dans (7), 
la convexité de S et la formule (8) seront démontrées en réduisant 
notre problème à deux problèmes standards déjà considérés. 
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A) Applications auxiliaires. Il faudra nous ser- 
vir deux fois du lemme sur l'application inverse à droite (2.1.5). 
D'abord, il existe une application M: Ÿ — X telle que A co M = J, 
II M () I & C1 ll y I. Ensuite, supposons que p: X — R° est définie 
par l'égalité (x) — ({xï, x), . .., (x, x)). Désignons Z — 
— p(Ker A). D'après le même lemme, il existe une application 
u: L— Ker À telle que 


pou—=1, In (OI<CIET. 


En outre, comme tout sous-espace de R°, Z peut être déterminé 
par un système d'équations linéaires 


2: biiës = 0, L=Y, ..s D) 
= 
ou, à l’aide de l'application 
B:R°— R?, fE=(2 bijE;) , 
1—= 
par la condition BE = 0. 
B) La fonction Si(a, y) est bornée. Puisque 
Az +y=0&x=M(—-y)+z, x € Ker A = 
= a, + (af, x) = a; + (aË, M (—y)) + (af, to), (10) 
en posant x, — 0, nous voyons, d’une part, qu'on a l'inégalité 
def 
inf max (a; + (ai, x) < max {la;| + Ci [Iyl}=X, (11) 
Ax+y=0 1<i<s 1<i<s 
et d’autre part, pour Az+y—0, d’après (10) 
max (a; + (ti, +))> min @;—CillIyDZ—X, (1) 


1Li<s 
parce que par hypothèse max ((r*, xo)) > 0 (x, € Ker À). De 
1<i<Ss 
(11) et (12) on tire l'estimation 
IS (a, pIS<K = max {lal+ Clay (15) 


C) Existence du minimum. Ayant désigné 4; — a; + 
+ (xt, M (—y)) + K et nous rappelant que 
To € Ker À CE: To); Fe ss (Le, Zo)) _ 
= p (to) € L = p (Ker À) = Ker f, 


nous voyons d’après (10) et (7) que S (a, y) + K est la valeur du 
problème 
max (à, + Ë;)—inf; 6€Le c—ini; 

+t<e, BE—0. (14) 
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D’après (13), S (a, y) + K > 0, et donc on peut sans rien changer 
ajouter à (14) la condition c > 0. 

Le problème (14) peut être amené à la forme standard d’un pro- 
blème de programmation linéaire (2) (voir 3.3.3) dans R°*!. Pour 
cela, désignons z, = c, z —c—ËE,;—ü;, z — (2, ..., z), 0 = 
= (1, ..., 1), à = (&, ..., &), 2 = (20, 2). La condition PE = 0 
s'écrit sous la forme 


BE 0 B(c0— 7— à) —cBO—Bz—pâ—0 > Bz>b, 


- 0 — > a 

2 É 4 pe | 2 
sont une matrice d'ordre 2p X (s + 1) et un vecteur de dimension 
2p (en fait, nous avons remplacé l'égalité B£ — 0 par deux inégalités 


RÉ Z0 et PE < 0). 
Par conséquent, le problème (14) est équivalent au problème 


z— inf, Bi>b, 2>0, (45) 


qui est de forme standard. Ce problème est compatible (par exemple, 
le vecteur (2X, 2K — &G,,..., 2K — à) est admissible, £ — 0 
correspondant appartient à ZL) et sa valeur S (a, y) + K est finie 
(et même non négative). D’après le théorème d'existence de 3.3.3, 


où 


il possède la solution 2 — Go 2 =(S(a, y +K, 2). Par consé- 
quent, le problème (14) a la solution E—(S (a, y)+K)0—z—G 
et alors 
S(a, y)+K— max {a;+8}= max {a +(af, M(—y)+É)+K 
1<i<s 1<i<s 
et 
S (a, y) — max {a; + (Rés z)}, 
1<Li<s 
où, d’après (10) et d’après la définition de l’application u: L — 
— Ker À, on a 
2 = M (—y) + pê. (16) 
D) Convexité de Set théorème de dualité. 
La fonction (a, y) > S (a, y) est la S-fonction du problème de 
programmation convexe suivant: 


max (1 Fes ns) — inf, —N;: a (is x) + dj — 0, 
Axty—=0. (17) 
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Posons Z— R° X X, Ÿ —R° X Y, 2 — (n, x), 
fo (z) = max (m1, - .., ns), 
Mg (OT, Gr, n'en, AD): 
et amenons (17) à la forme standard ((3(«, n)) de 3.3.2): 
fo(— inf, Àz+ (a, y) = 0. (18) 


Par conséquent, la fonction (a, y) > $S (a, y) est convexe (corollaire 
À de 3.3.2). D’après (13) elle est bornée, et donc continue sur l’espace 
Ÿ tout entier (proposition 3 de 2.6.2). D’après le théorème de dualité 
de 3.3.2 (rappelons qu'il n’y a pas d’inégalités dans le problème 
(18)), on a 


S (a, y) = 

= sup{(z*, (a, y))+infl(z*, Âz) + max (ns ..., no)]}. (19) 
Mais z*C(R°XY)*—R#XY#, je. z* se met sous la forme (a, 
y), a —(a, ..., as) ER°%, y* EY*, de sorte que 


CE (a, y)) = aa +(y*, y); (20) 


(27: An=5 X; ({xŸ, 2) — 0;) + (Y*, Ax). 


D'après la proposition 2 de 2.6.3, la transformée de Young- 


Fenchel de la fonction f (n) = max (n,, . .., n.,) sera de la forme 
0 sia;,>0, D a;=—1, 
f* (&) — sup ent | A (21) 
L L oo dans les autres cas. 
Maintenant on peut tirer de (20) et (21) 
inf (max (M1, ..., Ns) +(2*, Àz)) — 
z 
— … {an — MAX (M1 +...) ns) 2 tr + AËy*, D == 
n, X Îi— 
(@) si a; >0, >. di; AXy* + > ati —=0, 
= 1 i=1 (22) 
— oo dans les autres cas. 


En substituant ceci dans (19), on obtient (8). 
E) Lemme géométrique. Soient L un sous-espace et K 
un cône engendré par un nombre fini de points dans R°. Alors, il existe 
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un tel nombre N => 0 que pour tout a € R° 
p(O, (&+aNK <Np(0, L+a<Nlal (23) 


(la formule reste vraie également dans le cas (L+a) AK = @ 
si nous convenons que p (0, @) = —o). 

Démonstration. a) Soit À = cone {x,, ..., Zm}. Dé- 
composons chaque vecteur en deux composantes, dont une est con- 
tenue dans le sous-espace Z et l’autre y est orthogonale : 


a—b+c, Lj = Yi + Zi; AS PES 2 b,y:E EL, 


C; Z; € Lx, 
alors 


p(0, (Z+a)NK)=inf{lfllS EX, (É—a)eL}= 


= inf|| 2 hi (yi+z;) [ki >0, 2 A; (y; +z;)—b—cEeLi— 
=inf{| > MGi+z)|lu>0, Dune, ELI< 
i=1 


<inf{Z À; max {ly:l}+lce||A;2>0, D Lane, y:EL}. (24) 
ii 1<i<m i— 

D'autre part 

p(0, L+a)=inf{fn+alIneL}= 


=inf{in"+clin €EL}= le] SV 10/2 + 12 al. 
Puisque 


m 
À; > 0, > MZ =c<cEcone{z1, ..., 2m}; 
i=1 


nous voyons que (23) découle de (24) si pour un certain N, —0ona 


cEcone {z4, ..., 2m} À; >0, 
2 hiz; =C, > À, <Nilc| (29) 
i=1 i—1 


(ici dans (23) nous aurons NM =N,; max {|y;|}-+1). 
1<i<m 


b) Supposons que Li—lin{z;, ..., Zm}, dim Li—n. Choisis- 
sons toutes les familles d'indices 1 —={i1, ..., i,} pour lesquel- 
Jess ss Zi} est une base de Z;. À chaque telle famille 


correspond une AOPACANON linéaire A;:R"—Z, définie par la 


formule Az= À Tizi. Puisque {z,, ...,z; } est une base de 


L4, l'application inverse existe. 
18—0237 
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D'après le théorème de Carathéodory (voir 2.6.1), chaque 
vecteur c Econe {z4, ..., ZM} est une combinaison conique de <n 
vecteurs linéairement indépendants 2; 


C = M2 +... + ii: À, > 0, SLN, 


En complétant s’il le faut la famille {z:,, ..., zi,} de manière à 
obtenir une base de Z; par des vecteurs Zi «es Zi, €6t en 
posant hi, = de = Ài, =0, nous voyons que 

CA, =, ..., Ai), M,20, Ti c.., in). 


Par conséquent, 


1? 


D a, SnlA] Sa || A7 Vel Sr max {|| AT Iel. 


Ceci démontre (25) pour N, = n max {|| A5! 11}. 
I 


F) Conclusion de la démonstration du lemme 
du minimax. La seule chose qui nous reste à faire, c’est d'obtenir la 
relation (9). Pour cela, revenons à la première partie des problèmes 


14). L'élément Êt — (Ë,, ..., Ë.) est sa solution si et seulement si 
E+a<S(ay+k, i—1,...,5, EeL (26) 


(puisque S (a, y) + K est la valeur du problème, nous aurons l’éga- 
lité ici pour au moins un indice). En nous rappelant de la défini- 


tion de à, donnée dans C) et en désignant a = CRT as), où 
d=a—S (a, y)—K=a+(#, M(—y)—S (a, y), (27) 


nous pouvons récrire (26) sous la forme E; +a;<0. 


Ainsi Ë est la solution de (44) > È+a€(L+a)}N(—R:). 
Donc 


inf {È+ a| l'E est une solution de (14)}—p(0, (ZL + a) N(—Ri)). 


Puisque —R$ — cone {—e,, ..., —e.,} est un cône engendré 
par un nombre fini de points, le deuxième membre, d’après le lemme 
géométrique de E) est inférieur ou égal à Vo (0, L+a) Na |. 
Par conséquent, 


inf{lË+ a ||E est la solution de AA) ENla|, 
et puisque [Ë]<|Ë+ a] + |al, 
inf {|Ël IE est la solution de (14 EN + 1)lal. 
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Sia-0,ona (N + 1)la| <(N +2)| al, et parmi les solutions 


du probième (14) on peut en trouver une, désignons-la par ë, pour 
laquelle. 


LÉ] SW +2)a]. (28) 


Si a—0, alors £ —0 est une solution et (28) est à nouveau valable. 
En nous servant de la formule (16), nous trouvons d’après £ 


l'élément æ—zx(a, y). Dans l'estimation de cet élément nous 
tenons compte des inégalités 


IM(—yI<ClylL Ile OISCIË] (29) 


(comparer à la définition des applications inverses à droite M et 
u dans À)) et 


a“ x _— s x (27) 
el=(Z a) 7 <V smax{lal, ..., 1a1}< 
<V 1 max {jal + Cily IH IS (a, DT 
<Vstlal+C max [latlllyll+1S (a, yI1, (80) 
ainsi que de l’estimation (13) : 
À (16), (29) r (28) x (30) 
Ita, y <  Cily+C2é <CilyI+C2(W+2)lal < 
<Ci(+C(N+2)Vs max Ia ID lv ll+ 
: (13) 
+C2(W+2)Vs(lal+IS (a, y)< 
<Ci({+Vs max [lat 2C2(N +2) [y 114 2C2(N +2) V slal. 
Par conséquent, on a (9) avec les constantes 


C—max{Ci(1+C2(N+2)VSs max [lat,  Co(N+2 VS, 


C=max{C; (1+V5 max ||2* 1l2C2(N +2), 2C2(N +2) V s}. 


18% 
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$ 3.4*. Conditions nécessaires de deuxième ordre 
et conditions suffisantes d’extrémum 
dans les problèmes différentiables 


D 


Envisageons à nouveau le cas où les inégalités sont absentes. 


3.4.1. Problèmes différentiables à égalités. Considérons le pro- 
blème 


f(x) —extr; F(x =0. (1) 


Théorème 1 (conditions nécessaires de 
deuxième ordre). Soient X et Y des espaces de Banach, 
U un ouvert de X, et supposons que la fonction f: U—R et l’applica- 


tion F: U —- Y possèdent au point x EU une dérivée seconde de Fré- 
chet ; 
La, ÿ*, 1) = f(x) + @*, F (x). 
Si x fournit un minimum (maximum) local au problème (1) et si F 
est régulière au point x (i.e. Im F' (x) = Ÿ), il existe un multiplicateur 
de Lagrange y* € Y* tel que 


L,(x, y*, 1)=0, (2) 
et pour tout y* possédant cette propriété on a 
Lune U*, IR, R>0(<0), VhEKerF'(s). (3) 


Démonstration. L'existence de y* pour lequel on a l’éga- 
lité (2) a été démontrée dans 3.2.2. Envisageons maintenant le cas 
x € loc min (1). Soit k € Ker F’ (x). D’après le lemme de Lusternik 
(voir 2.8.5), on a h € To, où of = {x | F (x) — 0}, ïi.e. il existe 
une application r (+): [—e, el— o# telle que 


F(£+th+r(t)=0, r(tj=o(t), tE[—e, el]. (4) 
D'après (4), x thæ+r(#) est un élément admissible du problème 
pour £E[—e, el et, par conséquent, f(x) <f(t+th+r(t)), car 
zEloc min (1). Donc 


ff (EC+th+r()=L(c+th+r(t), y*, 1)= 
—£ (x, y*, 1)+%, (2, y*, 1) Ith+r (b1+ 
LES D Dh+r(, th+r(D]+o(E) = 


= (D +È Le (G ÿ% 1) De, A] (62). 


D'où l’on tire immédiatement (3). M 
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Théorème 2 (condition suffisante de mi- 
nimum). Supposons que l’on a les hypothès.s du théorème précédent 
et, en outre, pour un certain à« >> 0, on a l'inégalité 


Luxe, U*, 1)[k, RJ>2a|k|2, VAEKerF'(x). (5) 


Alors x est un point de minimum local pour le problème (1). 


Démonstration. Sans perte de généralité, on peut sup- 
poser que f (x) — 0. Désignons par B (h,, h,) la forme bilinéaire 


4 xx (&, U*, 1) (h,, k,l. D'après le théorème sur les dérivées mixtes 


(voir 2.2.5), B est une forme bilinéaire continue symétrique. Choi- 


sissons & >> 0 de manière à avoir 
p(s)=a(i—e)—2||B(1+s)e—[Be—-S<>0 (6) 


(puisque œ (0) = «/2 > 0, ceci est possible). 
Les fonctions F et £(-+, y*, 1) possèdent par hypothèse des déri- 


vées secondes de Fréchet relativement à x au point x. En nous ser- 
vant de la formule de Taylor (théorème 2 de 2.2.5) et prenant en 
considération les relations 


F(a)—0, £(x, y", 1)=0, Z,(x, y*, 1)=0, 


trouvons des nombres 6, > 0 et C, => 0 tels que pour [| [| 6, 
on a les inégalités 


LE @+h)—F" (@) LA = IE (@+Rh)—F (0) —F" (à) LANCIA IP, ; 
(7 


IL (c+R, y*, 1)—B(, RSS IAE. 


En appliquant le lemme de 2.1.5, construisons l'application inverse 
à droite, désignée par M: Y —> X, à l'application F” (x) ; alors 
F'(x)°M=1, |IM(WII<CHylI. D'après le nombre 8 > 0 
choisi précédemment, choisissons 6, 0 << Ô << Ô, de manière à avoir 

ÔCC, < &. (8) 


Supposons maintenant que || À || << ô et soit x + À un élément 
admissible pour le problème, i.e. F (x + h) — 0. Posons k, — 
— M(F' (x) [hl) et désignons par h, la différence k — h,. Alors, 
de l'estimation pour M (y) et des relations (7), (8), nous obtenons 


he SCIE’ (@) PISCC RP <e IA I, (9) 
F' (a) La] = F' (x) [Rk— he] = F' (2) []— F' (à) M (F' (x) [A]) = 0. 
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Ainsi, À. € Ker F’ (x). Il découle de (9) que 
A —e)HAI<SHAUS (+ Ee) IR II. 


Finalement on obtient, en prenant en considération (6), (5) et (7), 
fa+h)=£(z+h, y*, D >B(R, h—< IR? 
= B (hi+ he, ha he) — RIZ 
> B (ha, ha) —211B 11 Rat Re —H BU Re IP — 
à (5) ns (6) 
—SlR>(a(t—e?-21B81(4+e)e-1B81e-5)1R12>0, 
ie. zEloc min (1). 


3.4.2. Problèmes différentiables à égalités et inégalités — condi- 
tions nécessaires du deuxième ordre. Envisageons le problème 


fo@)— ini, Fr =0, f(x <0, i—1,..., m (à) 


En changeant, s’il le faut, les signes des fonctions, nous pouvons 
réduire à (3) tout problème du $ 3.2. La fonction de Lagrange du 
problème (3) est de la forme 


Le, pk = D fe) +@*, F (a). 


Théorème. Soient X, Ÿ des espaces de Banach, U un ouvert 
de X,x EU, et supposons que les fonctions f;: U—R, i = 0, 1,... 
.-., M, ainsi que l'application F: U —Y, possèdent au point x 
une dérivée seconde de Fréchet et, en outre, f; (x) 0 les aime 

Si x fournit un minimum local au problème (3), et si F est régu- 
lière au point x (i.e. Im F’ (x) = Ÿ), alors: 

a) l’ensemble D des multiplicateurs de Lagrange (y*, À, À), 
y CY*, ÀE RTE, À, tels que 


_ 


h>0, À>0, D Al, 
10 (0 
Lil: y*, À, o) = 0 
est un compact convexe non vide de Y* X RT* X R; 
b) pour tout h, contenu dans le sous-espace 
L={h\{fi(x), h=0, i>0, F'(2)[R1=0}, (2) 
on peut trouver des multiplicateurs de Lagrange (y* (ho), À (ho), 
Ào (ho)) € D tels que 


Lux (es Y* (Ro); À (ho); do (%0)) Lo Lol >0- (3) 
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Démonstration. Désignons, pour simplifier, 
F'(x)=A\, fi(x) = af. 


A) Considérons l'application ®: 6 — X* du simplexe 


o—{(A, M)lM>0, 2 =) 
1—=0 
définie par l'égalité @(A, Ao)= >) AstŸ. Alors 
i=0 


m 
(y*, À, ho) ED 22, Mat-+y*eA=ç (A ho) + AXYY — 


=0—=p(X, À) ElmA*—= (A, À) EGi= pt (Im A*). 


Par hypothèse Im À = Ÿ et donc (voir 2.1.7) Im A* — (Ker A)t; 
c'est donc un sous-espace fermé. Par conséquent 0,, étant un sous- 
ensemble fermé d’un compact, est lui-même un compact. 

Notons maintenant que Ker A* — {0}. En eîïfet, 


h* € Ker A* = (A%h*, x) — 0, Vz= (h*, Ax) = 0, 
Vrz = h* € (Im At = h* = 0. 


Puisque le sous-espace fermé Im A* d’un espace de Banach est lui- 
même un espace de Banach, le théorème de Banach implique l’exis- 
tence d’une application l': Im A* — Y* inverse à A*. Maintenant 


(y*, À, À) ED (À, ko) E Gi 
p (A Ào) + AXY* = 0 (4, do) € 01, 
y* = —Tp (, À). 


Par conséquent, D est l’image du compact ©, par l'application con- 
tinue (à, Ào) —> (—To (À, Ac), 1, Ào), C'est donc un compact. 

Le fait que D est non vide découle du principe de Lagrange 
démontré dans le $ 3.2. La convexité de D est une conséquence immé- 
diate de la condition (1). D'ailleurs, elle peut être déduite de la 
convexité de © et de Im A* en remarquant que les applications 
considérées ci-dessus étaient linéaires. Ceci termine la démonstra- 
tion de l’assertion a). 

B) De même que dans 3.3.1, nous remplaçons le problème à iné- 


D! # 


galités par le problème à égalités 
f(a)= max {fo (2) —fo(x), f1(2), ..., fm(d}— int; F(x)=0. (3°) 
Si x E loc min 3, alors x Eloc min 3’. En eïfet, 


zélocminz Ve 0, 2x: —x|l|<e, 
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F(t)=0, fr) <0= forte) <fo(t); fi (Le) < 0, 
i—1,...,m, F(x)—0=zxétloc min 3. 
Nous envisagerons ensuite le problème (3). 
C) Soit A, €L. En vertu de la compacité de D, il existe des 


(y*, À, Ào) tels que 
F (Ro) = Lrx (x, y*, À, À) [Ao: ho] = 


— max Lust, y*, À, Ào) [ho hol — 
ue À, Au)ED 


=mex|Ÿ lafi (0) Cho ho ++, F"(&) [ho ho M>0, 


2 À; = 1, 2 A;tt + AXy* = 0) . 


L’assertion b) est équivalente à l'inégalité Y (4,) > 0 
Supposons que Ÿ (4,) << 0. Notons 


À? 7 . 
a; (à) =—- fi (x) [ki ll i=0, :.., m; 


À? FRS (4) 
y (A) = F" (à) [ho ho, 
et envisageons le problème 
max (a; (À) +(x*, t))—inf; Ax+y(A) =0. (5) 


0Ki< 
Vérifions que l’on peut appliquer le lemme du minimax de 3.3.4 
à ce problème. En effet, 
max (t,æx)>0, VrxeEKer A 
0Li<m à 
est la condition nécessaire de minimalité pour x dans le problème (3) 
(voir le lemme 1 de 3.2.4). En outre, par hypothèse, l'opérateur A est 
surjectif. 
En vertu du lemme du minimax, il existe un élément x, (À) pos- 
sédant les propriétés : 
ne (Q)+{xr, t(A)))=S (a (à), y (à)), (6) 
où S (a (À), y (À)) est la valeur du problème (5); 
1 %o Q) 1 Ci max Ja Q) | + [y Q) 1} < CK. (7) 
On a alors en vertu de (8) (3.3.4) 


S (a (A), y (A)) = 


= max [5 Auf (©) Lo Ro +, F" @) Lo ko) 420, 
1=0 


Dit, D'act + Aty = 0) W(k). (8) 


i—=0 i—0 
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Mais alors il découle de (7) que || À, + xo (à) [| = © (À). D'après 
la formule de Taylor (voir 2.2.5), on a 


F (+ 20 (À) + ho) = F () + F° (à) [co (À)1 + 
+2 p° (D ho + 20 (À), Mio 20 (A)I-+ 0 (12) = 


= F'(@) Lo, (145 F" (Dm), (A) + 0 (A2) = 0 (A2) 
(rappelons que 
k€ L &Ker F'(x) 
et, en vertu de (5), 
F' (2) [& ()1-+ (42/2) F” (&) Lhos ol = 0). 


Dans la démonstration du théorème de Lusternik de 2.3.5, nous 


avons construit une application : U—-X du voisinage U3 x 
de manière à avoir 


Fa+p(@)=0 et Np@I<ÆATIE (x) 1. 
En posant r (à) = @(x+ xo (À) + Ah), on obtient 


F(z+x()+kk+r(d)=0, 
Lr IIS ILE (+ 20 (À) + Aho)l| = 0 (N?). 


Mais alors, en appliquant la formule de Taylor à jf; et en se ser- 
vant de (6) et (8), on obtient 


f (&+ %0 (À) + Mho-t r (A) = 
= max {fo (5 + 20 (À) ho r (A)) — fo (2), 
fa) +Motr ()), i=1, ..., m}= 
— max «xt, To (+ fi (t) Lo ol + 0 (1) < 


0Li<m 


< max (at, 20(X)) + fi (2) Los Rol) +0 (A2) = 


0<i<m 
= À Y (io) +0 (12) <O 
pour À? suffisamment petits. Ainsi 
Ÿ (ko) <0 = zx loc min 3'= ré loc min 3 ; 


cette contradiction démontre le théorème. M 
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3.4.3. Conditions nécessaires d’extrémum pour les problèmes 
différentiables à égalités et inégalités. Comme dans le sous-paragraphe 
précédent, nous considérons Île problème 


fo) inf; Fa =0, f;(x) <0. (3) 


Théorème. Soient X, Ÿ des espaces de Banach, U un ensemble 
ouvert de X, x EU; supposons que les fonctions f;: U—R, i = 0, 


4,..., m, et l'application F: U — Y possèdent au point x (admis- 
sible pour (3)) une dérivée seconde de Fréchet et f; (x) = 0, i = 
= Lists Me 


Supposons qu'il existe des multiplicateurs de Lagrange À € 
CRT, yYEY* et un nombre a >> 0 tels que À, >0 


Le y, à D = (+ DET (&)+F'*(2)[y*]=0 (1) 
et 
Lux (es V*, à 1)1R, A>2a | R IP (2) 
pour tout hk contenu dans le sous-espace 
L={h|(fi(@, h=0, i>1, F'(2[A]=0}. (3) 


Alors x fournit un minimum local au problème (3). 


Démonstration. A) Supposons que x + h est un élé- 
ment admissible, i.e. 


hia+h<0 i>1, F(c+Rh) = 0. (4) 


Effectuons l'estimation de l'expression f, (x + h) de deux manières 
différentes. Nous avons 


h(e+h) = ft G+h+ Dh +n+ 
+*, F(z+Rh)) -2 hif:(a+h)= 


=£(@+h y hi 1—Z Mi G+n. 6) 


La première méthode d'estimation est basée sur la décomposition 
directe 


f(r+h)=£(æ+h, y%, À - Di CLR 


= L (x, y, À, 1) + Le ÿ%, À 1) A] 
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> Âufs (x) — à A Q), hr (h) = 


= f(x) — D'ufi(&), k)+ri(k), (6) 


où le terme résiduel r;,(}) est 7 0 
La deuxième méthode est basée sur le fait que la somme 
5 hf (æ+k), en vertu des inégalités À, > 0, Î; + h) 0, est 
son positive et par conséquent, 
f(e+h>£(e+h, y, À 1)= 
= L (x, y, À, 1)+%,(&, ÿ*, À, 1)1R]+ 
+ Le (8 0%, À DIR, hl+re(k) = fo (+ BR h)+ra(k), (1) 


où B(h, h) désigne la forme quadratique _ Lo (x, y*, À, 4) [h, 


h], tandis que le terme résiduel est r, (h) —0o(|}h ||?). 

B) Désignons par Æ le cône consistant de tous les À pour les- 
quels (f! (x), h} 0, ix1, F'(th=0. 

En vertu du lemme de Hoffmann, un k arbitraire peut être décom- 
posé en une somme h, + h,, où h, € K et h, peut être estimé de la 
manière suivante 


RAECAPEAOEREA TAC LITE (8) 


Servons-nous maintenant de la remarque faite dans 3.3.4 après 
le lemme de Hoffmann et de la formule (5”) de 3.3.4: h, peut être 
également décomposé en une somme k, = h, + h;, où h. € L, tandis 
que h! possède l'estimation 


IISG IA@, ho]=Ct— DA, 4} (0) 
Nous nous sommes servis du fait que F’ (x) [hi] —0 (car h, EK) 
et du fait que 
AG, ISA, M+HRI=IA (@), RD 
= — (fi(x), h;) (car(fi(x), h;)=0, et (f(x), ha) KO). 
C) Il découle de (4) que 
O=F(x+h)—F (2) —F" (5 14] +ro(n), 


Of; (G+h)=(fi(&), h)+pi(h), i=1,..., m, 
où ||ro(h)ll et lp; (k)| sont des grandeurs de l'ordre O(||h{[|?). 


(10) 
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Utilisant ces estimations et (8), nous voyons que si x+h est un 
élément admissible, nous avons 


LAESABNOTOIE ETUI (11) 

Fixons &, € (0, 1] (qui sera précisé par la suite) et choisissons 

ô E (0, | B ||!) de sorte que l'inégalité [[k [| < 8 implique les 
Me ui 


À 11 D Ir, MIISa Al re IS SNARIR. (22) 


i=1 j—=0 
Choisissons ensuite un nombre ÀA>=>0 pour avoir 
AC3* (min À) — Ca max Qi || fi (@)I) 120, (13) 


et enfin choisissons &, de manière que e = (C1+ À) e, implique les 
inégalités 
ei, af—e}—-2|B|et+e)  — Be —-a/220 
(14) 
D) Conclusion de la démonstration. Sup- 


posons que æ + h est un élément admissible. Représentons k, comme 
dans B), sous la forme de somme: h = h, + h, + h,. Deux cas sont 
possibles : a) [|A [| => Aë: | À || et b) 1! RI< 4e: I] À |. Dans le 
cas a), nous avons d” après (9), pour {|} || < ô, la relation 


A8, AI IA C2 (— : Gi (a) RD). (45) 
eS en vertu de (6), (15), (11), (12) et (15), nous obtenons 


FC ni Dr fi (x), h, + ho) + 
en (12) " 
Lr(h) > Jo(&)+ AC (mini) &llk|l— 
— max 11 / @ID Cela lle = 


= je À + 8x1 1 (AC (ni) — Ca max (1 4 (DID — 02 fo) 


Supposons maintenant que nous avons le cas b). Alors [A [| 
< A&; ||» |}, donc, en désignant h, = k; + h,, on obtient en vertu 
de (11) et (12): 


IAl=IR+RI<S (A +CG)alkl= el 
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Alors h=h+h, où (—e) TRAN<IAN<(+e) AI. 
Appliquant maintenant ces inégalités, ainsi que (7), (2), (12), nous 
obtenons 


hG+DSh @+B(h, k)+re (= 
= f)(&+B(hiths, hi+h)+ra(h) = 
= fo(&)+B(h, h)+2B(h, h)+B(hs hi) + 
+) > f@+(a(—e—21 Be (1+e)— 


81e) IR IP>f ©. 


Le théorème est démontré. 


$ 3.5. Applications de la théorie à l’algèbre et à l’analyse 


Dans ce paragraphe, nous avons regroupé quelques exemples où 
la solution d'un problème d’extrémum est la clé de la démonstra- 
tion d’un résultat théorique. Le théorème fondamental de l’algèbre, 
le théorème sur le supplémentaire orthogonal et le théorème de 
Hilbert se rapportent aux théorèmes les plus importants du cours 
universitaire. Le critère de Sylvester et les déterminants de Gram 
sont également des instruments usuels des mathématiciens. Le 
sous-paragraphe 3.5.5 est plus recherché. Nous l’avons inclu ici, 
étant donné l'importance fondamentale du fait que dans le calcul 
des variations classique et la théorie de Morse l'indice des formes 
quadratiques est fini. 


3.5.1. Théorème fondamental de l’algèbre. 

Théorème. Tout polynôme à coefficients complexes de degré 
supérieur ou égal à l'unité possède au moins une racine complexe. 

Démonstration. Soit p (2) = &o + &iz +. . + 4,7" un 


polynôme de degré n > 1, où a, -£ 0. Envisageons le problème élé- 
mentaire 


J () = Ip () F— inf. (3) 
Lemme. Le problème (3) possède une solution. En effet, 
n—1 


f (2) = 1? () e=|3 aef> (ete Ÿ laz| 121 — 


= jan [2 12%] (140 (2 )) + + 00 


quand z— co. D'où l’on tire que tous les ensembles de Lebesgue sont 
compacts ; maintenant, l’assertion du lemme découle de la continuité 
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de la fonction f (+) et du corollaire du théorème de Weïerstrass 
(voir 3.1.7). 

Soit z une solution du problème (3). Sans perte de généralité, 
on peut supposer que z — 0 (autrement nous aurions considéré le 
polynôme g(z) = p(z—z)). Ainsi 

f(0)<f(2) = a +az+...+az F, Vzec. 


Si 4) — 0, alors le point zéro est une racine du polynôme et il n’y 
a rien à démontrer. Supposons que ay = 0, le nombre s vérifiant 
Aa =...— 4, = 0, a; 0. Fixons € — ei® et considérons la 
fonction d’une variable œ (t) = f (t£). Par hypothèse, le point zéro 
donne un minimum à cette fonction. On a 


dr 
gr |. = 
dR à — — ; : 
a [Go + aabeis0 + O (%)) (ao + aste 9 + 0 (E#))] leo = 


|, k—1,..., s—1, 
(25)! Re (açaseï®s) — (25)! |a,] [al cos (s0+ y), k=s. 


Puisque s > 1, la fonction 0 -—- cos (s8 + y) prend des valeurs 
positives, ainsi que négatives. Par conséquent, d’après le lemme de 
3.1.1, la fonction œ@ n'aura pas de minimum au point zéro, si l’on 
choisit C de manière à avoir œt°) (0) 0. Cette contradiction démon- 
tre que a) = 0. E 

Les premières ébauches de l'énoncé du théorème fondamental de 
l'algèbre sont dues à Girard (1629) et Descartes (1637). Descartes 
écrivait que chaque équation possède tant de racines qu'elle a de 
degrés. Il arrive parfois que certaines de ces racines sont fausses ou 
inférieures à rien. Il est admis que la première démonstration du 
théorème fut donnée par Gauss (1799). La démonstration exposée 
ci-dessus est inspirée de D’Alembert (1746-1748). 

3.5.2. Critère de Sylvester. Comme nous l’avons déjà vu plusieurs 
fois dans ce chapitre, les conditions de deuxième ordre se rapportent 
(dans le cas du minimum) au fait qu’une certaine forme quadratique 
est non négative (condition nécessaire) ou positive (condition suffi- 
sante). Dans les cas de dimension finie, la positivité de la forme 
quadratique s'établit à l’aide du critère bien connu de Sylvester. 
Nous montrerons ici que ce critère lui-même se déduit du théorème 
de Fermat. 

Rappelons qu'une matrice symétrique Am = (@;j), à, j = 1, ... 

., M, djj = 4;j;, eSt dite définie positive si la forme quadratique 


correspondante xT Az — à i3X;t; = Qm (x) est positive pour tout 


vecteur non nul x € RT. LE déterminants det A,, où Az, —= (a;;), 
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i,j=1,...,k, 1<k< m, sont appelés mineurs principaux de 
la matrice A. 

Théorème (critère de Sylvester). Pour qu'une 
matrice soit définie positive, il est nécessaire et suffisant que tous ses 
mineurs principaux soient positifs. 

Démonstration. A) Pour une matrice d'ordre un, l’asser- 
tion du théorème est triviale. Supposons que le théorème est démontré 
pour les matrices d'ordre n — 1, n > 2, et démontrons-le pour les 
matrices d'ordre n. Soient À, une matrice d'ordre n et À, _; Sa sous- 
matrice (d’ordre n — 1) obtenue en éliminant la dernière colonne 
et la dernière ligne. 


Pour un E — (E,, ..., £m-1) € RT-1 arbitraire, désignons € — 
= (E,,..., Ém, 0) ER. Alors Qu (Ë) = Qn (À) et si À, est 
définie positive, il en est de même pour la matrice À,14, donc 
det 4, > O0, hd: .., n—A. 

Ainsi nous devons démontrer l’assertion suivante. 

Lemme 1. Soit det A > 0, k —1,..., n — 1. La matrice 
A, est définie positive si et seulement si det À, > (0. 

B) Soit x = (x,, ..., x») € R7, où x, = 0. Posons 


y — (YA .. Un 1) 1e (ta/xn, ..) Er dn) CRE 
Gus Bon): 
Il est clair que 


Qn (x) = 2TAnt = (YA, y + 2aTy + Ann) za. (1} 
Considérons le problème d’extrémum élémentaire 
f (y) — YTAnay + 2aTy + nn > inf. (2) 


Lemme 2. Dans les hypothèses du lemme 1, le problème (2) 
a une solution. 

Démonstration du lemme 2. Par hypothèse, det A4, > 0, 
k=1,..., n — 1. Puisque le déterminant dépend continûment 
des éléments de la matrice, pour un & > 0 petit les mêmes inégalités 
det Az (&) > 0, k — 1, ..., n — 1, restent valables pour les mi- 
neurs principaux de la matrice À, (£) = A,_, — &E (où E est la 
matrice unité). Par hypothèse de récurrence, nous en déduisons le 
fait que la matrice 4, _, (e) est définie positive, ainsi que l'inégalité 


Qn-1 (9) = YTAny = YT(Ann — EE) y +ely F > e | y |, 
d'où l’on tire, en se servant de l’inégalité de Cauchy-Bouniakovski, que 
[FI = yTAnay + 2a7y + ann | > 8 | y À — 

—2/[al1y][— [ain |— 00 


quand | y | — co. Il ne reste qu’à appliquer le corollaire du théorème 
de Weierstrass (voir 3.1.7). 
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C) Démonstration du lemme 1. Soit y une solution du 
problème (2). En appliquant le théorème de Fermat, on obtient 


Of" (y) [A] = 2hT(Any + a), VhER' 1 


A, ny+a=0 y = —A;! a, 
d’où 
Î (y) — Ann — aTAn!1a. 
En décomposant ensuite det À, relativement à la dernière co- 


lonne, et puis tous les mineurs de la formule obtenue, sauf un, rela- 
tivement à la dernière ligne, nous obtenons l'égalité 


n—i 

det À} — Ann det An1 — >. LikAnilhn — 
1:h=tl 

n—1 


4, R=1 


= det An_1 {ann — a An-sa}= det An-4f (y). (3) 


ik, Y/ À = 
det Ans Her 


Ici &;, est le complément algébrique de l'élément a;, dans la ma- 
trice À, , (celle-ci étant symétrique, on a Gin = ri), de plus, nous 
nous sommes servis de la formule classique qui donne les éléments 
de la matrice inverse. 

En vertu de ( ) et (2), on à Qn (x ) — Î (y) x}, pour x, 0 et, 


en particulier, f ÿ) = Q, (x ), où x = (Yi, ns Yn- 1 1) 0. Par con- 


séquent, si À, est définie positive, alors f (y) = Q, (x) > 0 et 
d'après (3) det 4, 0. Réciproquement, si det À, >0, on a 


1U>0 et Q(n=fua>fuz>0 pour r, #0. Si —0, 


alors 2 (6;,::.,6 0) = (Ë, 0) et Q, (x) = Qh: ()>0 pour zÆÙ 
par hypothèse de récurrence. Ceci démontre le lemme 1, et donc 
le critère de Sylvester. 


Exercice. Donner un exemple lorsque det A4, > 0, k = 1, n; 
mais ©, (x) < 0 pour un certain x Æ 0. 


8.5.3. Distance d’un point à un sous-espace. Théorème sur le 
supplémentaire orthogonal. Déterminants de Gram. Soient À un 
espace de Hilbert réel à produit scalaire (+ | -) et Z un sous-espace 
de X. Un élément x est dit orthogonal à L si pour tout y € Lona 
(x | y) = 0. L'ensemble de tous les vecteurs orthogonaux à un sous- 
espace donné constitue un sous-espace appelé supplémentaire ortho- 
gonal du sous-espace L et noté Li. La théorie des espaces de Hilbert 
se base sur le 
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Théorème du supplémentaire orthogo- 
nal. Soit L un sous-espace fermé de l’espace de Hilbert X. Alors X 
se décompose en une somme orthogonale directe L @ L+; autrement 
dit, pour tout zE X il existe des éléments uniques y EL,z€L* tels 
que T = y 2 

La démonstration de ce théorème est fondée sur l’étude du 
problème de la plus courte distance du point x à la variété affine Z, 


Iz—yllinf, yez, (1) 
que nous avons déjà considéré dans 3.3.4. En nous servant mainte- 
nant de certains traits spécifiques des espaces de Hilbert, nous pou- 
vons aller plus de l’avant. 

Lemme. Si L est fermé, la solution du problème (1) existe. 

Démonstration. À) Trouvons d’abord la solution du 
problème posé dans le cas de la droite ! = {x = E + nt}, n 0. 
Soit (t) = (x — E — in | x — E — én). La fonction + o (té) est 
quadratique et possède un minimum unique, puisque le coefficient 
de #2 est positif. D'après le théorème de Fermat, À € abs min 9 
p(f =0 (n | x — E — Ën) = 0, d'où il découle immédia- 
tement que 
p°(x, l)=llz-z|P=|flx—E£6lP—(x—E61e), k | 

e=v/lni 2=6+in (2) 
et que x—2 est orthogonal à n. Le point z est le pied de la 
perpendiculaire abaissée de x sur L. 

B) Démontrons maintenant le lemme dans le cas général. Si 
zEL, il n’y a rien à démontrer. Mais si x & L, alors, L étant fermé, 
la valeur de p pour le problème (1) est positive. Soit {y,} une suite 
minimisante pour le problème (1), ie. y, € Let [| — y, | + 0. 
Sans perte de généralité, on peut supposer que la suite {|| z— yn ||} 
est monotone. Montrons qu'elle est fondamentale. Soit 0 < 


€ (1x — yn |Ë — 02/2 < 8. Construisons la droite / passant par 
les points y, et Yn+r, k > 1, et abaïssons, comme nous l’avons fait 


précédemment, la perpendiculaire de x sur L: soit z son pied. Puisque 
la longueur d’une oblique est d’autant plus grande que son pied 
est éloigné du pied de la perpendiculaire, on a 


ya > 1e — Une lez > 1e vne ll 
> [Ya —Yntr | LÜZ—- Yntr + Yn —21L2112— Yan ll= 
= 2(x—v, P—|1z—x1fP)/2< 2e, 


d'où l’on tire que {y,}; est fondamentale. 
19—0237 
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Puisque X est complet et L est fermé, la suite {y,} converge vers 
un certain élément y. D’après la continuité de la norme, || & — y || =- 
= imflz—-y, | = 0. 


n— 00 

La démonstration du théorème est maintenant très simple. Si 
y est la solution du problème (1), alors, pour tout vecteur z € Z, 
la fonction @ (it) = ||x — y — tz ||? possède un minimum au point 
zéro. En appliquant de nouveau le théorème de Fermat, @° (0) = 0, 
nous obtenons immédiatement (x - — y|z) =0, ie. T—ye Li. 
S'il existe deux représentations x = y + 2, = yo + 2, y: EL, 
Z ELLE, =, 2, alors y — yes = 2 — 22 = (Yi — Ye | y — 
— y) = 0 Yi = Yy a = 2 

Remarque. Bien sûr, pour démontrer l'existence de la solu- 
tion du problème (1), on aurait pu, dans l’esprit du sous-paragraphe 
3.1.7, se servir de la semi-continuité inférieure (dans la topologie 
faible) de la fonction x N (x) — || x || et de la compacité faible 
de l’ensemble de Lebesgue {x | N (x) < 1}, ï.e. de la boule unité 
dans l’espace. Néanmoins, il ne faut pas perdre de vue que la com- 
pacité faible se déduit de l’isomorphisme isométrique de X et X*, 
et ce dernier se démontre à l’aide du théorème sur le supplémentaire 
orthogonal. (Théorème sur la compacité faible de la boule unité 
dans un espace dual d’un espace séparable normé, voir [KF1, p. 197.) 
La fonction NV est convexe et continue, donc fermée. D'après le 
théorème de Minkowski (voir 2.6.2), elle est la borne supérieure de 
fonctions affines, qui sont continues dans la topologie faible, elle 
est donc semi-continue inférieurement dans cette même topologie. 

Trouvons maïntenant la distance d’un point à l’hyperplan. Sup- 
posons que l'hyperplan Æ est donné par l'équation IH = = {y | (y |e) = 
— à}, [le || = 1. Le carré de la distance du point x à l’ hyperplan H 
est la valeur du problème différentiable || z — y |? = (x — y | x — 
— y)— inf; (y le) = «, qui possède d’après le lemme démontré 


une Solution y (il est clair que [|z — y || et [| x — y |? atteignent 


simultanément leur minimum). 
En appliquant la règle des multiplicateurs de Lagrange, nous 


obtenons, en omettant les détails triviaux : 


À A A A n # 
= (c—ylz—-y)+A(yle, Z,=0=æy=x+ee, 
h=a—(xle), p(r, H)=|lt—yll=|hel =|a—(r|e)]. 


Obtenons enfin la formule explicite bien connue pour la distance 
d’un point x,, appartenant à l’espace de Hilbert X, au sous-espace 
L,, enveloppe linéaire de n vecteurs linéairement indépendants 
Lis + + + Zn. Le Carré de cette distance est la valeur du problème 
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élémentaire de dimension finie suivant : 


F(@)= lot D œil? int. (4) 


L'existence et l’unicité de la solution sont ici évidentes, on peut 
néanmoins faire également un renvoi au théorème sur le supplé- 
mentaire orthogonal. Mais en écrivant f («) sous la forme 


f (a) 2 (x; |x;) ma;+22 (to | Ti) Gi + (To: Lo); 


nous voyons que le problème (4) coïncide avec le problème considéré 
dans le lemme {1 du sous-paragraphe précédent, si l’on remplace 
la matrice À, par la matrice 


((x: 1x) lé, j = 0,1, ..., n) () 
et la matrice À,-, par le mineur de la matrice (5) obtenu en élimi- 


nant la première colonne et la première ligne. Une matrice de la 
forme (5) est appelée matrice de Gram et son déterminant est le déter- 


minant de Gram du système de vecteurs {xo, %1, . . ., x,}; on le note 
G (Zo, Lys + + +, En). Si & est la solution du problème (4), alors, en 


vertu de la formule (3) de 3.5.2, on a 


. G (to Ts se. An) = (4) Gt, ..., An). 
Ainsi 


p (os L) —_ (7 (x))1/2 ee (G (To Lis Tn)/G (1; à NS Tn)) /?. (6) 


En guise de conclusion, nous laissons au lecteur le soin de résoudre 
‘le problème de dimension infinie analogue à celui d’Apollonios 
(envisagé au chapitre T). 


Exercice. Soit A: X — X un opérateur linéaire continu compact 
dans l’espace de Hilbert X. Trouvez la distance du point z à l’ellipsoïde : 
6é— {15 Ay, y <1}. 


3.5.4. Axes principaux d’une forme quadratique. Théorème de 
Hilbert. Il est bien connu que toute forme quadratique Q (x) dans 
un espace euclidien de dimension finie peut être amenée, par une 
transformation orthogonale des coordonnées x = Uy, à la forme 


diagonale Q (x) = Q (Uy) = D A:;y2. Dans ce cas, les vecteurs 
20 = Uel), où {e()} sont les éléments de la base orthonormée 
standard dans les coordonnées y, sont dirigés le long des « axes 
principaux », i.e. sont les points stationnaires de Q sur la sphère 
EAST. 

Sans exagérer, on peut dire que la généralisation de ce fait en 
dimension infinie par Hilbert fut à l’origine de la création tout 
d’abord de la théorie des espaces hilbertiens et ensuite de toute 
l'analyse fonctionnelle. 


19% 
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Rappelons les notions nécessaires. Soit X un espace de Hilbert 
réel séparable à produit scalaire (+ | -). La suite {x,} converge faible- 
ment vers x Si (y | x,) — (y | x) pour tout y € X. L'opérateur linéaire 
continu A: X — X est appelé auto-adjoint si (x | Ay) = (Ax | y) 
pour tous x, y € X. La forme quadratique Q (x) = (Ax | x) engen- 
drée par l'opérateur À est dite faiblement continue Si x, ——> x =- 


taibl. 
= Q (tn) + Q (x). 

Enfin, l’opérateur À est appelé compact s’il applique tout en- 
semble borné en un ensemble précompact. Dans notre cas, ceci équi- 
vaut à l'implication x, 1 | Ax, — Axll— 0 (c'est de 
cette définition que se servait Hilbert lui-même). 

Théorème de Hilbert. Pour que la forme quadratique 
Q (x) = (Az | x), où À est un opérateur linéaire continu auto-adjoint 
dans un espace de Hilbert séparable X, soit faiblement continue, il est 
nécessaire et suffisant que l'opérateur À soit compact. 

Dans ce cas l’espace X possède une base orthonormée e, constituée 
par des vecteurs propres de l'opérateur À et 


Q(2)= À An (& 1 en)? 


Il est évident que l’assertion concernant les formes quadratiques 
de dimension finie, énoncée au début du présent sous-paragraphe, 
découle immédiatement de ce théorème, puisque dans un espace de 
dimension finie tout opérateur linéaire continu est compact. 

Démonstration. A) Suffisance. Soit À un opé- 
rateur compact et {x,} une suite qui converge faiblement vers x. 
Alors, d’après le théorème de Banach-Steinhaus ([KF], p. 188), 
elle est bornée, i.e. il existe un nombre C >> 0 tel que x, | <C, 
Vn. Alors on a également || x [| & C. L'opérateur étant compact, 
on à || Âx, — Ax || —- 0. Finalement, lorsque n — oo, 


< | (At | Zn) — (At 12) 1 + [Am læ) — (Az la) 1 K 
< || Az, — Az [xs [+ Az — Az x << 
< 2C || Az, — Azx [| —- 0. 
B) Construction de la base orthonormée. 


Supposons que la forme © est faiblement continue. Considérons le 
problème d’extrémum 


[(Axl2)l—sup, (œlx <1, z€e£, (1) 


où Z est un espace fermé. 

Lemme. Le problème (1) à une solution. 

En effet, comme nous l’avons déjà mentionné dans le sous- 
paragraphe précédent, l’espace hilbertien X est isométriquement 
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isomorphe à son espace dual, et alors sa boule unité {x |(x|x)<1} 
est faiblement compacte. 

D'autre part, la décomposition X — ZL @& Lt démontrée dans 
le sous-paragraphe précédent implique l'égalité Z = {x | (x | y) — 
= 0,yE Li} = (Li)tet six, € Lest une suite qui converge vers x 
faiblement, on a (x | y) — lim (x, | y) — 0, Vy € Li, de sorte que 
x E L. Par conséquent, Z est faiblement fermé et donc l’ensemble 
des éléments admissibles du problème (1) est faiblement compact. 
Par hypothèse, (Ax | x) est faiblement continue. Maintenant l’exis- 
tence de la solution découle du théorème de Weierstrass (3.1.7). 

Soit 3, la solution du problème (1), où Z — X. Supposons tout 
d’abord que 3, = 0. Alors (Ax | x) = 0 et donc tout vecteur donne 
un extrémum au problème élémentaire (Ax | x) — inf. En y appli- 
quant le théorème de Fermat, nous obtenons Ax = 0, i.e. tout vec- 
teur est un vecteur propre à valeur propre zéro et Q (x) = 0. Dans ce 
cas le théorème est démontré. 

Supposons que 3, Æ 0 et e, est une solution du problème (1) 
avec Z — X. Pour fixer les idées, supposons que (Ae, |e,;) < 0; 
alors e, 0 est la solution du problème 


(Ax |z)— inf; (x|zx) <1. (2) 
La fonction de Lagrange de ce problème est de la forme 
Lx, Aus ho) = A0 (At |2) + A (x |x) 
et, en vertu de la règle des multiplicateurs, il existe des ho > 0, 
À > 0 qui ne s’annulent pas simultanément et vérifient 


Laess Ans No) = 2h + 2Ae, = 0. 


On voit facilement que ni À, ni À, ne peuvent s’annuler. En vertu 


de la condition de non-rigidité complémentaire, on a |e, | = 1 et, 
ayant désigné À, — — À.,/À,, on obtient Ae, = Ae,, À, = (Ae, le.), 
de sorte que définitivement 

Âe; = Mer; 81 GE | À Ê | ex | = 1. (3) 


Supposons maintenant que = vecteurs orthonormés étre ae 
qui sont des vecteurs propres de l'opérateur À (à valeurs propres 
As : -., Àn), Sont déjà construits. Considérons le problème d'’extré- 
mum 


[(Az 2) |— sup, (r1z) <1, (xle;) =0, 
ul: (4) 


D'après le lemme, ce problème possède une solution. 
Désignons la valeur du problème par 3,+.,. À nouveau 3,41 = 0 
implique Ax = 0 pour tous les x € [lin £e,, ..., e,}l:. Dans ce 
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cas le théorème de Hilbert est déjà démontré: 


n 


Âx= 2 A;i(tle;)e, Q(x) 2 À; (xle;)?, 


i—= 


et la première de ces égalités implique évidemment la compacité 
de A. 


Soit 3n+1 = O0 et supposons que e,+, est la solution du pro- 


blème (4) : An+1 A (Aer +: | En+1); | An +1 | = n+1 Alors En+1 ES la 
solution du problème 
(Ax|x) 


sup, (xx) Li, (xle;)—=0, i=1,...,n (9) 


et, d'après la règle des multiplicateurs de Lagrange, il existe 
des gs Ms he tels que AO, ns 0 et 


Art ho ere + hneienes + 2 Âe;=0, hi ((En+1l€n+1) —1)=0. (Ü) 


Calculons le produit scalaire de la première égalité tour à tour par 
Ex» - - -, en; en se servant du fait que les e; sont orthonormés et 
orthogonaux à e,+,, on obtient 


Art lo (Aenule;)+k;=0, ES ER (3 
d’où 


à; Su ho (Aensle:)= — Anti (en+11Ae;)= — ho A (En+11e;) =Ù 


pour i—=1, ...,n. Mais alors on a dans (6) À 0, hui 0 et 
len+1l = 1. Désignons Anya= —Àn:1/Ao.. Alors 
Âe; +1 a Ân +1€n+1) |en+1 | = L | An+1 | — 
= |(Aen+1 |En+1) | = 8n+1 (7) 
Aïnsi, on peut continuer la construction par récurrence. En défi- 
nitive, nous obtiendrons ou bien 3x7 — 0 pour un NW fini, ou bien 
une suite {e,}1=1 de vecteurs propres orthonormés de l'opérateur A. 
Il découle immédiatement de nos constructions que |A, | > 
>I1kIZ>...>lA1 | >... En effet, si l’on passe de n à n +1 
dans (4), l’ensemble des éléments admissibles se trouve restreint, 
et par conséquent 3» = [An | > än+1 = | Ân+1 |. La suite 
{en}n=1r | en | = 1, converge faiblement vers zéro et donc | À, | = 
— | (Ae, |e,) | — 0, car la forme (Ax | x) est faiblement continue. 


Considérons le supplémentaire orthogonal Z1 au sous-espace Z 
engendré par les vecteurs {e,},=—., et envisageons le problème 


[(Ax fx) [— sup, [(œIx) 1<1, xezZt. (8) 
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D'après le lemme, ce problème possède une solution. Sa valeur 
Vérifie 3 < Min ÿän — 0, elle est donc nulle. Par conséquent, 
Az = 0 sur Z1. En prenant une base f,, ..., f., . .. dans l’espace 
Lt, nous obtenons une base constituée des vecteurs £e;};=., et {f;}. 
Alors, si 


- > lee + X (ef) fr 


É=1 
on a Az— >) Ay(xlez)e,. Posons A,z= > Au(xlez)es. Alors 
kR=1 RkR=1 


chaque opérateur À, est compact et 
IA, — AÏ = sup {| Az — Az Ir] <1} < 
Z max |A | — 0. 
k>n+1 


Par conséquent, l’opérateur A est la limite d’une suite d'opérateurs 
compacts convergeant relativement à la norme, il est donc compact 
lui-même ([KF], p. 234). 

En outre, 


O0 


Qt) = (Az = (D lu (cles) elr)= D As(xle:)2. 


R=1 
Corollaiïire. Les vecteurs e, et —e, sont les points stationnaires 

du problème d'extrémum 
Q (x) = (Az |x) —extr, (x |zx) = 1. (9) 


Si tous les À, diffèrent entre eux, ce problème n'a pas d’autres points 
stationnaires. 

Démonstration. Par définition, les points stationnaires 
du problème (9) sont les points où la dérivée de la fonction de La- 
grange 


L = (Arr) + (xx) 
s’annule. Comme précédemment, lorsque xest un point station- 
naire, on a À 0 et Ax—hx, où À — —A4/À,. Par conséquent, 


k (tie) = (Arler) = (t|Aer) = An (tlen), 


donc (x | e,) 0 seulement si À = À,. Ceci implique immédiatement 
l'assertion que nous démontrons. 

Pour conclure, supposons que la forme Q (x) — (Ax | x) est 
définie positive (tous les À, sont positifs) et considérons l’ellipsoïde 


6 = {&|(Axlax) = 1} (10) 


en nous limitant pour simplifier au cas où tous les À, diffèrent. 
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Les points stationnaires + du problème 
(x |z)— extr, (Ax]zx) = 1 (11) 


déterminent les directions des axes principaux de l’ellipsoïde, tandis 


que || x |} détermine les longueurs de ses demi-axes. Constituant à 
nouveau la fonction de Lagrange 


L(X, Us Lo) = Lo (x | T) + ua (Az | x), 


nous trouvons LOT + LA X = 0, d’où, comme précédemment, At=\t. 
Ainsi les directions des axes principaux de l’ellipsoïde (10) se 


déterminent par les vecteurs propres de l'opérateur A: xt — 
==|[x9 |le,, n —1,2,..., et les demi-axes [|1(® || sont égaux à Az{/2, 


Exercice. Soit À un opérateur compact auto-adjoint. Disposons ses 
valeurs propres positives et négatives par ordre de décroissance de leurs valeurs 
absolues : 

Meet MER EMI Mess ee 0 
et soient eÀ, ex les vecteurs propres correspondants de l'opérateur A. Notons 
SE (Ra, +. .…, Rn-1), Sn (1, - - +, hn_1) les valeurs des problèmes d’extrémum 
Q (x) = (Az 1x) — sup (inf); (clh)=0, i—1,...,n—1. 
Démontrez que l’on a alors 


hi — min SR (hys co, ne) (An = max Sn (1 -.., An-1)), 
{ha 2e... hn-1} {Ras .... hn-1} 


ce qui est atteint lorsque h} — ex (hy = ex). 


3.5.5. Formes quadratiques de Legendre. Dans ce sous-paragraphe 
nous continuons l’étude des propriétés extrémales des formes qua- 
dratiques dans un espace de Hilbert et nous démontrerons le théorème 
de Hestenes, qui joue un rôle important dans le calcul des variations 
classique. 

Définition. La forme quadratique Q dans un espace de 
Hilbert X est dite forme de Legendre si elle est faiblement semi-con- 
tinue inférieurement et si la convergence faible de x, vers x et la con- 
vergence de Q (x,) vers © (x) impliquent ensemble la convergence 
forte de x, vers x. 

La dimension maximale des sous-espaces Z sur lesquels la forme 
quadratique Q est définie négative, i.e. Q (x) 0 pour tout x € L, 
s'appelle indice de cette forme ; on le note ind Q. 

Théorème de Hestenes. Toute forme quadratique de 
Legendre a un indice fini. 

Démonstration. Considérons à nouveau le problème 
d’extrémum 


(Az zx) = Q(x) int, (la) KT. (1) 
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L'existence dans le problème (1) est garantie, comme précédem- 
ment, par le théorème de Weierstrass (3.1.7): la boule { x | (x | x) < 
< 1} est faiblement compacte, tandis que Q est faiblement semi- 
continue inférieurement par hypothèse. Si la valeur du problème 
(1) est nulle, alors Q (x) > 0, Vx, l'indice de Q s’annule et le théo- 
rème est démontré. Supposons que la valeur du problème (1) est. 
négative. Alors, comme dans le sous-paragraphe précédent (problème. 
(2)), la solution e, du problème ({) est un vecteur propre 


A =hMe, [eal—=1, À <0. 


Nous allons à nouveau construire par récurrence un système ortho- 
normé en trouvant successivement la solution des problèmes d’extré- 
mum 


(Ar|x) = Q(@)—-inf, (xix) LA, (tle;) — 
CR RE (2) 


| 


et en obtenant ainsi des vecteurs propres 
Âe; = Àe;, (e; le;) = 1, ele Ne here, 
sis 0: (3) 


Montrons que notre construction se terminera en un nombre fini 
d'étapes ; le problème d’extrémum (2) n’aura plus de solutions non 
nulles. En effet, supposons que la suite {e; | i > 1} est infinie. 
Alors elle converge faiblement vers zéro. Puisque Q est semi-continue 
inférieurement et {À;} est monotone, on a 


lim À, = lim À, = lim (Ae,le,)= lim Q (en) ZQ (0) = 0. 


n +00 nr 00 ñn +00 


Mais À, < 0 et, par conséquent, lim À, = 0. Donc {e,} converge 
faiblement vers zéro et l’on à Q (e,) = (Ae, | e,) = À, —+ 0. D’après 
la condition de Legendre, || e, || doit tendre vers zéro, ce qui est 
faux, car |le, || — 1. Cette contradiction montre qu'après un nombre 
fini V d'étapes notre construction se terminera. Sur le supplémen- 
taire orthogonal Lx = (lin {e,, ..., ex})” la forme doit être non 
négative. 

Supposons que la forme © est délinie négative sur un certain 
sous-espace L et soit {f,} une base de Z (infinie si dim Z = ©). 
D'après le théorème sur le complémentaire orthogonal (voir 3.5.3), 
on a fn=£g,+h,, où g, ELn, hhELn. Si dim ZL, i.e. le nombre 
de vecteurs de la base {f,}, est supérieur à NV — dim Z}y, alors 


les vecteurs g4, ..., £n+1 sont linéairement dépendants, i.e. 
N+1 


SO angn—=0, où tous les «, ne sont pas nuls. Mais alors 
n=—= 
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Sr N+1i N+i N+1 


Œnfn= 2 Anhn EL: donc Q(2 & nfn) 20, d'où à Anfn=0; 


Pr 
puisque one QIz est définie pa La déni égalité 
est impossible, puisque {f,} est une base et, par conséquent, 
dim ZL<N. Par définition de l'indice, on a ind ON. D'autre 
part, la forme Q est négative sur L}Y, donc 

N 


N 
2€ Ly=z= 2 (les) = Q (= (Ace) = 2 À; (xile;)? << 0 
i=1 i= 
pour zx =Æ0. Par conséquent, ind Q > N, ïi.e. ind Q = N. 


CHAPITRE IV 


PRINCIPE DE LAGRANGE DANS LES PROBLÈMES 
DU CALCUL DES VARIATIONS CLASSIQUE 
ET DE COMMANDE OPTIMALE 


Le contenu de ce chapitre est résumé par son titre. Nous prêtons 
une attention particulière, d’une part, à l’analogie entre les deux 
variantes de la théorie, analogie que nous soulignons en unifiant 
les notations, et, d'autre part, à la clarification des différences qui 
existent entre les problèmes classiques et contemporains. Nous envi- 
sageons d’abord les conditions nécessaires dans le problème que nous 
appelons problème de Lagrange et auquel on peut réduire de nombreux 
problèmes du calcul des variations classique. Ensuite, nous démon- 
trons le principe du maximum de Pontriaguine, qui est une des 
méthodes les plus importantes pour les problèmes actuels de com- 
mande optimale. Le reste du chapitre est consacré à des classes spé- 
ciales de problèmes et à certaines conséquences de la théorie géné- 
rale. Les conditions suffisantes d’extrémum sont envisagées en moins 
de détail: nous nous limitons seulement à des situations particu- 
lières. 


$ 4.1. Principe de Lagrange pour le problème de Lagrange 


4.1.1. Position du problème et énoncé du théorème. Fixons un 
intervalle fermé À = [«, Bl GR et envisageons l’espace de Banach 


E = CT(A, RS XC(A, RNXRXR, 
constitué par les éléments & = (x (+), u (-), to, ti). 
Dans cet espace, considérons le problème 
Bo(x(-); u (+); lo 4) = 
t1 
=\f (£, x (t), u (t)) dt + %Ÿ (£o» x (to); Li x (t1)) —extr, (1) 
to 
= pt, & (6), u (t)), (2) 
B;(x(-), u (-), Lo» ti) = 
12 
= | fi 2 (0, (0) dt+ bits 2 (to), Es 2 (6) SO. (3) 


to 
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Dans (1)-(3), on a 
;: Y = RK,. V; : W — KR, ==" 0, le m , op: V— R", 


où V et W sont des ouverts dans les espaces R X R7 X R’'et R x 
X R° X R X R” respectivement. Toutes les fonctions considérées 
ci-dessus sont supposées au moins continues. Le symbole & a la 
même signification que dans le $ 3.2. 

Le problème (1)-(3) sera appelé problème de Lagrange sous forme 
de Pontriaguine. Des cas particuliers de ce problème ont été discutés 
dans les $$ 1.4, 1.5 et 3.1. Des fonctionnelles du même type que #;, 
contenant une partie intégrale aussi bien qu’une partie terminale, 
ont été appelées fonctionnelles de Boltz (voir 1.4.2 et 3.1.3). Lors- 
que la partie terminale dans la contrainte ®;, Z 0 est une constante, 

la 


i.e. cette contrainte prend la forme \f: (é, x, u) dt Z a;, nous 


lo 
dirons, en suivant Euler, que cette contrainte est isopérimétrique. 
Si, par contre, le terme intégral est absent, la contrainte 1; (£,, x (to), 
t,, æ(t:)) Æ O est appelée condition aux limites. 
La contrainte (2) est appelée relation différentielle. Une telle 


forme de la relation différentielle, résolue relativement à x, est un 
trait caractéristique de la forme de Pontriaguine du problème. 
Lagrange posait la contrainte différentielle en écrivant l’équation 


Ÿ (t, x, x) — 0 (brièvement, ceci était mentionné dans 1.5.1). 
Enfin, contrairement au chapitre I, l'intervalle de temps 
Léo, t11 dans le problème (1)-(3) n’est pas supposé fixe. 
Nous appellerons le quadruplet £ — (x (+), u(-), t,, t,) € # 
processus de commande pour le problème (1)-(3), si £,, t, E int À, 
(&, x (t),u (t)) E V pour t € Aet la relation différentielle est satisfaite 


sur [t,, {11 tout entier, i.e. x (t) — œ (t, x (t), u (t)), et processus de 
commande admissible si ce quadruplet est un processus de commande 
et en outre les conditions (3) sont vérifiées. 

Le quadruplet & = (x (-), u (+), to, t,) est le processus optimal 
dans le sens faible, ou extrémum faible pour le problème (1)-(3), si 


c'est un extrémum local dans l’espace &, i.e. il existe un e > 0 
tel que pour tout processus de commande admissible Ë véri- 


fiant la condition || ë — € Ile <TE£ on a une des deux inégalités 


Bo(E) > PBo(Ë) (dans le cas du minimum) ou #, (£) < PF, (Ë) 
(dans le cas du maximum). 
On appelle fonction de Lagrange de ce problème la fonction 


1 
LC) 80) do bi PC), à ho) = | Lt +1, (4) 


to 
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« 


ou 
MER, p()ECL(A, RE), Al, ..., Âm) € R*# 


sont les multiplicateurs de Lagrange, 


m 


La, u)=Ù Mhz, u)+p(h(r—qlt,z u)) (5) 


i=0 


est le lagrangien ou la partie intégrale, et 
m 
D(los Tor 1: m)= 2 Ai (os Los É1s T4) (6) 
i= 


est la partie terminale. 
Par la suite dans ce paragraphe et dans ce qui suit, nous nous 


D) 


servirons à nouveau des abréviations suivantes 
L. (= L.(t, (8), z(#), u(#)), 
X 


Les 


L, G)=L, (£, x (t), & (0, u (t)), 


Lu(t)=Lu(t, &(#), 2 u (t)), 


= or), bre ()): 
Li, = Liy (&(-), u (+), ci di; p(-), hs A) etc. 


Théorème d’'Euler-Lagrange. Supposons que les 
fonctions f;: V—R, i — 0,1,...,m, op: V — R' ef leurs dérivées 
partielles relativement à x et u sont continues dans l’ouvert V de l’espace 
R X R° X R’, tandis que les fonctions b;: W—R,i—=0,1,...,m 
sont continüment différentiables dans l’ouvert W de l’espace R X 
X R°X R X R'; supposons en outre que x(-)E CT(A, R), 
à (-)EC (A, R'), &, H Eint À vérifient 


(4, xt), u(H)EV, 4€A, (os Z(bo), ls T(H)) EW. 


Si E—(x(.), u(:), . 4) est un processus optimal dans le sens 
faible pour le problème (1)-(3), alors il existe des multiplicateurs 


de Lagrange hi >0 (dans le cas du problème du minimum) ou 
oO (dans le cas du problème du maximum) et p(:) ECT(A, R, 


À = (À, ..., Àm) qui ne s'annulent pas simultanément et vérifient 
les conditions suivantes: 
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a) La fonction de Lagrange est stationnaire 
relativement à x (+) (Lyc) = 0): 


7 L.(D+L,(0 =0, (5) 
L.(t)= (1h k=0, 1: (8) 
relativement à u (:) (Lucy= 0): 
L, (t) =0; (9) 
relativement à t,: 
L=0 ed; (10) 
b) on a la condition de concordance des signes: 
À z0, i—1,...,m;: (11) 
c) les conditions de non-rigidité complémentaire sont vérifiées 
À:@,(Ë)=0, i—1,...,m. (12) 


De même que dans les $$ 3.1, 3.2, les inégalités (11) signifient 
que À; >0sil'ona #, (£) < 0, À; LO dans la condition (3), À; < 0 
si l’on a #,(£)=>0 dans la condition (3) et À, est de signe arbitraire 
si #; (€) = 0. 

L'’assertion de l'existence des multiplicateurs de Lagrange véri- 
fiant l’ensemble des conditions a) à c) est brièvement appelée princi- 
pe de Lagrange pour le problème de Lagrange (1)-(3). 

Montrons que le théorème est tout à fait conforme au principe 
général de Lagrange dont nous avons parlé au chapitre I et dans 
3.1.9. En effet, la fonction de Lagrange £ est une fonction des trois 
variables x (+), u (+) et (fo, t,). Ainsi, en vertu du principe général 
de Lagrange, il faut considérer trois problèmes: 


(a) L(æ(-), u(-), do as PC), À, À) + extr, 


(B) L(&(-); (+); do és P(-)s À Ro) rextr, 
(y) L£(&(°), u (+), Los C4, D À, Ro) —+ extr. 


Le problème (x) est le problème élémentaire de Boltz et les con- 
ditions de stationnarité (7) et (8) sont écrites conformément à 1.4.2 
et au théorème de 3.1.3. Le problème (6) est également un problème 


de Boltz, mais il est dégénéré puisque u n'apparaît pas dans le la- 
grangien et u (to), u (t,) n'apparaissent pas dans la partie terminale. 
L’équation d’'Euler-Lagrange se transforme donc en (9), tandis que la 
condition de transversalité perd sa signification: 0 — 0. Enfin, 
(y) est le problème élémentaire, tandis que (10) est tout simplement le 
théorème de Fermat (voir 1.3.1 et 3.1.1). 
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La condition de non-rigidité complémentaire et celle de concor- 
dance des signes sont également écrites, comme nous le savons, con- 
formément au principe général de Lagrange, appliqué aux contraintes 
du genre inégalités (voir 3.1.5). 

Ainsi le théorème principal du présent paragraphe peut être 
énoncé de la manière suivante : si les fonctions qui apparaissent dans 
la position du problème sont suffisamment lisses, alors on a le principe 
de Lagrange pour l’extrémum local. 

On peut écrire la condition de stationnarité en plus de détails. 
En vertu de (5) nous obtenons: 

à partir de (7) 


TT ONUE. Zi (Ta) 


(on appelle parfois (7a) équation une) 
à partir de (9) 


0 — — p () Pu G)+ 2 his (£); (9a} 
à partir de (8) 


p (Ex) =(— 1} 1 Le. k—0, 1: (Ga) 
enfin, à partir de (10) 


O=(— A (+ a+ de (6) = 

= (— TD LE + p G) EG) — 6 GI 
+ dan + CN D (en) 2 (En) = (DLL fe (en) — p (x) @ Gn)] +de 
ou 


hf ()=(— 010. (10a) 


ps 


p (#x) p (éx) — 
La fonction 


Ha, p,u)=Lz—L=po(t,z,u)—Ù Âfi(t,æ u) (13) 
X 1—=0 


sera appelée fonction de Pontriaguine du problème considéré. En 
s’en servant, on peut récrire les équations (7a) à (10a) et l’équation 
(2) sous la forme suivante 
de ñn n 
= À y = —H, H,=0 (14) 
et 
p(tx)=(—1)" br Hi) =(—-1#14,,  k=0, 1 (15) 
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Remarque. On appelle parfois la fonction (13) fonction de 
Hamilton. Nous donnons une autre signification, plus naturelle du 
point de vue de la mécanique classique, au terme «fonction de 
Hamilton », dont nous nous servons quand il s’agit de la fonction 


GE (t, x, p) = H(t, x, p, u(t, x, p)), (16) 


où u(t, x, p) est la fonction implicite déterminée par l'équation 
H,, (t,x,p,u) = 0. Lorsqu'on a les hypothèses standards du théorème 
des fonctions implicites, les équations (14) prennent la forme usuelle 
du système canonique hamiltonien : 


dr _ & dp _ & 
7 = pr = — x (17) 


Il est utile de remarquer que l’ensemble des hypothèses du théorè- 
me énoncé est complet dans un certain sens. En effet, pour déterminer 
les fonctions inconnues (x (+), p (-), u (-)), nous avons un système 
constitué des équations différentielles (2) et (7a) et de l’équation 
finie (9a). En exprimant à partir de cette dernière (si c’est possible, 
comme dans le cas où les hypothèses du théorème des fonctions impli- 
cites sont remplies) la fonction u (-) en termes de x (+) et p (+), nous 
obtenons un système de 2n équations différentielles scalaires (équiva- 
lent au système (17)). Sa solution générale dépend de 2n constantes 
arbitraires ainsi que des multiplicateurs de Lagrange À;, parmi les- 
quels m sont indépendants. En y ajoutant encore {, et t,, nous obtenons 
en tout 2n + m + 2 inconnues. Pour les déterminer, nous avons 
2n + 2 conditions de transversalité (15) et m conditions de non- 
rigidité complémentaire (12). 

Ainsi, le nombre des inconnues coïncide avec le nombre des 
équations. C’est cela que nous avions en vue en affirmant que l’en- 
semble des hypothèses est complet. Il va de soi que la résolubilité 
du système obtenu n’est aucunement garantie par ce fait. 


4.1.2. Réduction du problème de Lagrange au problème diffé- 
rentiable. Désignons par Ÿ l’espace C (A, R°) et écrivons le pro- 
blème (1)-(3) de 4.1.1 sous la forme 


Bo(E)—extr;, D(É)—0, P:(E) <O0, i=1,..., m, (1) 
où 
D (Ë) 6) = x (6) — pt, x (té), u (6)). (2) 


L'application ® et les fonctionnelles ; sont définies dans le do- 
maine 


T'= {@(C), u(), t, h)1(, x(), u(G)EV, tEA; 
to t1 Eint À, (lo, Z (to) tir  (t1)) € W} 
de l'espace €. 
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Le problème (1) est de la même forme que le problème de 3.2.1 
du chapitre précédent ; le principe de Lagrange a été déjà démontré 
pour ce problème. Les hypothèses du théorème correspondant se 
divisent en trois groupes: les espaces principaux sont des espaces de 
Banach, les applications sont différentiables, et l’image de l’applica- 
tion de dimension infinie est fermée. Vérifions que toutes ces hypothèses 
sont vérifiées pour le problème (1). 

Le fait que les espaces Æ et Y sont des espaces de Banach 
est évident : les espaces CTet C' sont les principaux exemples d’espaces 
de Banach que nous avons envisagés (voir 2.1.1 et 2.1.2). 

La différentiabilité (ou plus précisément la diffé- 
rentiabilité continue selon Fréchet) des fonctionnelles æ,, i — 
— 0,41,..., m, découle des résultats du $ 2.4. 

En effet, on peut étudier la partie intégrale de la même manière 


que dans la proposition 2 de 2.4.2, en remplaçant partout x (:) 
par u (+), tandis que la différentiabilité de la partie terminale est 
démontrée dans 2.4.3 (c’est l’opérateur des conditions aux limites). 
Alors, en vertu des formules (9) de 2.4.2 et (3) de 2.4.3, nous avons 


pour Ë — (x (+), u (-), ta, 4), n=(%2(), v(-), To T1) la relation 


{1 
F: (Ë) [n] = | Pix (ë) À (ë) Le (t)u(t)) dt + fi (ts) Ti — f 3 (bo) To + 


to 


+ bot data + Book (To) + bash (En) + La (0) To+ du T (Ës) Ta (8) 
(comparer au lemme de 3.1.3). 

L'application (2) est également continûment différentiable selon 
Fréchet (voir proposition 3 de 2.4.1). Sa dérivée, en vertu de (14), 
2.4.1, est de la forme 


D’ (Ë) In] (4) = À (8) — Qx () R (8) — Eu (6) v e (4) 

| Il découle de la différentiabilité continue selon Fréchet des 

fonctionnelles ?; et de l’application ® qu’elles sont strictement dif- 

férentiables, ce qui est nécessaire dans le théorème sur le principe de 
Lagrange. 

Le fait que l’image de l'application D est fermée 
découle de la régularité de cette dernière : l’image ®’ (Ë) & coïncide 
avec Ÿ. En effet, si l’on prend arbitrairement y (+) € Y — C (A, R'), 
on peut poser v (+) = 0, t;, = 7, = 0. L’équation 

D (£) LR (-), 0, 0, 0] (-) — Y (-) " 
est équivalente à l’équation différentielle linéaire } (t) — ,(t) h (£) — 
— y(t) à coefficients continus qui possède une solution »(:)E€ 
€ CT(A, R°) en vertu du théorème d'existence pour les systèmes 
linéaires (voir 2.5.4). Ainsi, toutes les hypothèses du théorème de 
3.2.1 sont vérifiées. 


20—0237 
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Pour préciser, nous supposerons que (1) est un problème de 
minimum. Conformément au principe de Lagrange, si E—(x(:), 
u(-), to» t:) est une minimale locale de (1), il existe des multi- 


plicateurs de Lagrange A À ER et un élément yÉ EYE — 
— (C(A, R9)* tels que pour la fonction de Lagrange 


LE; y, A l)=Z(c(-), u(-) to 5 Y%, À ho) = 


t1 m m 
= | (Du a u)) d+ D hi Go 2 (to), te 2) +yeD (5) 
to i=0 i=0 
on a les conditions de concordance des signes, de non-rigidité complé- 
mentaire et de stationnarité 


Le) 
Le. "4 


POS P.:5=0, Lit 0; L4, =0, k— 0, 4. 


Les trois relations qui constituent la deuxième partie de cette impli- 
cation, seront appelées par la suite stationnarité relativement à 
x (+), à u (-) et à {, respectivement. 

Nous remarquons toutefois que la fonction (5) n’est pas identique 
à la fonction de Lagrange (4) de 4.1.1. En nous servant du théorème 
de Riesz sur la forme générale d’une fonctionnelle linéaire continue 
dans l’espace C'(A, R) (2.1.9), nous pouvons seulement affirmer 
que 

a, n(C)= | dv (1, 
À 

Où v (té) = (v, (£), . . ., v, (#)) est un vecteur ligne constitué de fonc- 


tions canoniques de variation bornée. En substituant cette expression 
dans (5), nous obtenons, compte tenu des notations (6) de 4.1.1: 


li m 
L= | (DM, 2 (0, u()) a+ 
to  Îi—=0 
He |av(e) {x ()— (te, ze), u())}+ (to, (bo), ta tt). (6) 


En comparant cette formule avec (4) à (6) de 4.1.1, nous voyons que 
la fonction de Lagrange Z s'obtient de la fonction £ si la fonction 
v (-) est absolument continue et sa dérivée s’annule en dehors de 
Léo, t,] et coïncide avec p (+) sur ce segment. Cette situation nous 
rappelle le sous-paragraphe 1.4.1. De même que le lemme de Dubois- 
Raymond nous a permis de déduire l’équation d’Euler sans hypothèse 
préalable concernant la différentiabilité de la fonction t+-- p (t) — 
— L. (x), une généralisation appropriée de ce lemme nous permettra 


de démontrer maintenant la continuité absolue de la fonction v (:). 
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4.1.3. Lemme de Dubois-Raymond généralisé. Supposons que 
sur l'intervalle fermé [a, B] la fonction vectorielle a (+): [a, B] — R°* 
est intégrable selon Lebesgue, la fonction matricielle b (+): [œ, Pl —- 
— £ (R", R') est continue, tandis que v (-): [x, B]—- R* est une 
fonction vectorielle canonique de variation a t, sont des points 


distincts de l'intervalle (x, B), cx € R'%, k = 0, 1,..., p. 
Si, pour tous Fe h (+) E CT (Lx, BI, R”), on a É égalité 
B 
|a DaOat+ | avt (&) {h (©) HOROT 1 (&)=0, (1) 


alors la fonction v (+) est absolument continue; sa dérivée p (+) est 
continue sur la, fl, sauf peut-être aux points t, où elle possède des 
limites à gauche et à droite, elle est absolument continue dans tout 
intervalle qui ne contient pas les points t, et l’on a 


p (t) = a (t) — p (t) b (t) presque partout, (2) 
p (a) = p (B) = 0, (3) 
P{ta +0) —plix —0) = 0e. (4) 
t 
Démonstration. En posant h(=v+ | n(s) ds, on ob- 
tient de (1) : 
B B p B U 
(jewa- [a VObD+D c} v+ | a (0 | n(odsa+ 
œ RkR=0 œ œ 
B t ik 
+40 10 fe 00 {nc @a+ 3 a | + (s) ds — 0. 


Puisque y € R" et les fonctions n (+) € C (La, SI Re peuvent être 
choisies arbitrairement et indépendamment l’une de l’autre, on a 
premièrement 


p p p 
ati — | aHb@+Y =0 (5) 
œ œ R=0 


(car on peut poser n (+) — 0, y arbitraire) et, deuxièmement, pour 
tout n C +) EC (La, de R’) on a l'égalité 


b 
ja 20 Énwaat+ | v (9 n (— 


th 


[a 00e [nbas x | m6) de —0. (6) 
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En changeant l’ordre d'intégration dans les premier et troisième 
termes à l’aide de la formule de Dirichlet (voir (5) dans 2.1.9), en 
désignant par la lettre s la variable d’intégration dans le deuxième 
terme, en posant 


4, a<s<i, > 
mn@= 0 LICs (D 
et en utilisant l'égalité 
B B 
[Ed = Eu @ à (8) 


valable pour toutes les fonctions absolument continues ([KF], p. 337), 
écrivons (6) sous la forme 


B B B B 8& 
À À] a (t) dt) n (s) ds + | dv (s)n(s)— | (| dv (#)b (t)) n (s) ds+- 
B p B 8 
+ 25 Culte, 1,1(5) n (s) ds = | dA (s) n (s) + | dv(s)n(s)=0, (9) 
& k=0 J J 


s B B 
A (s) — | {| a (t) dt— \ dv (t) b(#)+ ÿ CHIL, tx] (0)} do. 
a O [eo] R=0 


La fonction À (-) est absolument continue sur [œ, fl et À (4) = 0, 
c'est donc la fonction canonique, d’autre part, v (-) étant une fonc- 
tion canonique de variation bornée, il découle de (9) et de la pro- 
priété d’unicité dans le théorème de Riesz (voir 2.1.9) que A (s) +- 
+ v(s) =0. Ainsi v(:) est absolument continue et sa dérivée 


p(s) = v'{(s) pour st, s'écrit (nous nous servons à nouveau 
de (8)): 


p(s)=v'(s)= —A"(s) = 


B B a 
=—{a(@at+ | p( 00 dt cuite, m1 (9). 
e : k=0 


Cette formule montre à son tour que p (-) est continue partout sauf 
aux points {;, où l’on a (4); en outre, (2) est vérifiée. L'égalité 
p (B) = 0 est évidente, tandis que l'égalité p (x) = 0 est équivalente 
à (5), de sorte que (3) est démontré. D 

4.1.4. Déduction des conditions de stationnarité. Ainsi, nous 
avons montré que si Ë fournit un minimum local au problème (1)-(3) 


de 4.1.1, alors il existe des multiplicateurs de Lagrange À, > 0, 
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À ER" et y* EC (A, R'})* tels que l’on a les conditions de con- 
cordance des signes et de non-rigidité complémentaire pour À et la 
condition de stationnarité 


#n 


a) Lac) =0, D) Luc)=0, c) Z,, 0, k=0, 1, (4 


Las 


où Z est défini par l'égalité (6) de 4.1.2 et Zxcy, Luc) et Ze, 
z(-)=z(-), 


s’obtiennent de Les, 4. Li en substituant 
u(-)=u(:), le . k = 0, 4. 

Passons au déchiffrage des conditions (1). En calculant la dérivée 
de la fonction £, nous prenons en considération le fait que le premier 
et le troisième termes de la formule (6) de 4.1.2 constituent une fonc- 
tionnelle de Boltz dont la dérivée est donnée par la formule (3) 
du même sous-paragraphe, tandis que le deuxième terme est la com- 
posée de l’opérateur de relation différentielle et de l’application 


linéaire n (-)-- | dv(t)n(é); sa dérivée s'obtient donc en prenant 


À 
l'intégrale des formules (4) de 4.1.2 relativement à dv (6). 

A) Stationnarité par rapport à æx(-) En 
prenant la dérivée de Z relativement à x (+), nous obtenons en vertu 
de (1a), pour tous les h (+) € CT (A, R?), l'égalité 

ñ ê m 


0 = £a lA( due? «(8 h (6) dt + 


#m —— 


Se 


+ À dv (0 4 (0 — a (© h (03 + ah Go) + dauh )+ 2) 
À 
Voyons d’abord le cas +, =. PA D'après le lemme généralisé de Dubois- 


Raymond, (2) implique que la fonction v (-) est absolument continue 
sur À et que sa dérivée p (+) = v’ (-) est continue sur À partout, 


sauf éventuellement aux points £, et É., où elle possède des limites à 
droite et à gauche et les relations (2) à (4) de 4.1.3 sont vérifiées, ce 
qui dans notre situation signifie que 


dpldt= — p (0) Ex (0 +49, 330 À are (0) (3) 


0» t1] 
pour Ÿ to, Ë t1, p(a) = p(B)=0, œetf étant les extrémités de À, et que 
Pr 0-0 En p(a+0)—p(h—0)=Ù (4 
(ici k ee. est la fonction caractéristique, égale à 1 sur [é. t,] 
et à 0° en dehors de ce segment). Il découle de l'équation (3) que 
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p(-) vérifie l'équation différentielle linéaire homogène sur les 


semi-intervalles [æ«, {) et (t4, B]. Puisqu'elle s'annule aux extré- 
mités &« et f de ces semi-intervalles, le théorème d'unicité de 


2.9.3 nous donne p(t)= 0 sur AN fo, t] et p (520) = D (+0) =, 
Désignons maintenant par p (-) la solution de l'équation (73) 


de 4.1.1 qui coïncide sur l'intervalle (#,. 4.) avec p (+) (dans cet 
intervalle les équations (7a) de 4.1.1 et (3) sont identiques). Puisque 


(a) est linéaire, la solution p (-) est définie sur l'intervalle À tout 
entier et appartient à CT (A, R'#*) (voir 2.5.4). Pour cette solution, 


on a p (&o) = p (ty + O)etp (#1) — p (t1 — 0) et comme p (&, — 0) = 
—= 0 et p (ft, + 0) = 0, (4) se transforme dans la condition (8a) de 


41.1. Ainsi pour p (-) les conditions de stationnarité (7) et (8) 
(ou (7a) et (8a)) de 4.1.1 sont vérifiées. 


Pour é, << t,, nous obtenons à la place de (3) l'équation 
dpldt = — p (à) Pa (i) — ) 2 Mi 


XG,., 1 | 


dont la solution p(:) s'annule sur [a, #) et (és, Bl. Dans ce cas, 
il faut désigner par p(:) celle des solutions de l'équation (7a) 


de 4.1.1 qui coïncide avec (—1)p(:) sur (é, to), et alors les 
conditions (7), (8) de 4.1.1 seront remplies. 


Enfin, pour f;—1{,, nous pouvons à nouveau nous servir 
du iemme généralisé de Dubois-Raymond, mais maintenant v’ (4) = 
— p (f}= 0 partout sur À, sauî peut-être au point t = t4, où l’on 
doit encore avoir la condition péi+0)—p (é 0) = + lu = 0, 
d’où Leo + de, = 0. En prenant en guise de P(- ) celle des solutions 


de l’équation (7a) de 4.1.1 pour laquelle P (bo) = =. he nous voyons 
à nouveau que les conditions (7), (8) de 4.1.1 sont remplies. 

B) Stationnarité par rapport à ud(-). Si l’on 
prend la dérivée de Z relativement à w (+) compte tenu que v (:) 
est absolument continue, tandis que sa dérivée p (+) — v’ (+) est non 
nulle seulement dans l'intervalle (,, 4.) et coïncide avec p (-) dans 
cet intervalle, on obtient 


OZ, to(-1= | {D Lifiu (0 — P (0 Eu (6 } v (9 dt. 
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Puisque cette égalité est valable pour tous les v (-) € C (A, R°”), en 
nous servant à nouveau de l’unicité dans le théorème de Riesz 
(voir 2.1.9), nous obtenons 


2 afin (8) — p (0 Eu (9 = 0, 


ce qui coïncide avec l’équation (9a) et donc avec la condition (9) 
de 4.1.1. 
C) Stationnarité par rapport à f;. Puisque 


La 


Let), UC) tu di .)—ZL(0), ue), b, 35...) 


= [bb 20, 2(@)}- 
[5 (6) (0 (H—o(é, z(b, u(b)}dt=0, 


les dérivées de ces deux fonctions relativement à #, au point 


E—(x(-), u(-), to À) coïncident et comme on a l'égalité Z;, —0, 
la condition (10) de 4.1.1 est également remplie. 


4.1.5. Problème aux dérivées supérieures. Equation d’Euler- 
Poisson. Fixons à nouveau un intervalle fermé A & R et envisageons 
l’espace 

E,=C(A, RÔXRXER, 
dont les éléments sont les triplets & = (x (-), ts, t,), la fonction 
x (+): A R7 étant continûment différentiable jusqu'à l’ordre s 
inclus ; to, t, E int À. En parlant du problème aux dérivées supérieures 
(dans le calcul des variations classique) nous entendons le problème 
d’extrémum 


Po (E)—extr; ME SO, i—1Â,..., m, (1) 


DS 


OU 
P, (£) = | fi, &(), .., a (6) dt+ 
to 


+ Di (or Z (do), -.., 26 (bo), ds, x), ..., a 9 (H)) (2) 


dans l’espace Æ.. En outre, dans (1), (2) f;: V—+—R, #,;: W—R,; 
i—=0,1,...,m; Vet W sont des ensembles ouverts des espaces 
R X (R')S+1 et R X (R7)S X R X (R")° respectivement; f; et 1; 
sont au moins continues. Un triplet & = (x (+), t,, t) EX, est 
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appelé admissible pour le problème (1), (2) si (£, x (£),..., xt (H))€ 
EV,tE Aet 


ao) ss AP D), dé Ge s0 MON C-ME 


Un triplet admissible £ = (x (+), ts, t:) sera appelé solution 
(locale) du problème (1), (2), s’il donne un extrémum local à la fonc- 
tionnelle $, dans l’espace E., i.e. s’il existe un e >> 0 tel que pour 
tous les Ë — (x (-), to, t,) admissibles vérifiant 


IÉ—ÉlE <e li —il<e, k=0, 1; 
Ix—x(:) Ilosça, R") < €, 


on a une des inégalités #, (ë) > (É) (dans le cas du minimum) 


ou Po (EE) << F0 (Ë) (dans le cas du maximum). 
Montrons que le problème (1), (2) aux dérivées supérieures se 
réduit au problème de Lagrange. Pour cela, notons 


g = (m,..., &) € (R'), 


c()=@()z() ..., 262 (), 
u()=20(), p()=(m() -.., ps (C). 
Alors le problème (1), (2) se met sous la forme usuelle pour les 
problèmes de 4.1.1 
l1 
fott, æ(), u (8) dt Volt æ (to), ta, æ(H))—extr, (1°) 


to 
l1 


| Ji (£, æ (1), u (t)) dt + Ÿ: (o: (bo); Li; & (t1}) — 0, 


to 


titan J=d,...,s—1, 2=u (3) 
à fonction de Lagrange 
1 
La) u() to 3 pt), À h)= | Ldt+l, (4) 
où l 
Lt,æx, æ, j= > fit, &, u)+ 


s—1 


+ À p5 (0 Ge 250 + pe (9 Ga) (5) 
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et 


e e (s—1) 
lp» Los Los +5 TO A \== 


m 
. 1 | : 
= à Ai (los Los Los ++. : 2) é nm oi ) (6) 


En paraphrasant dans ce cas le théorème de 4.1.2, on obtient une 
condition nécessaire d’extrémum : 

Théorème. Supposons que les fonctions f;: V—R, i — 
= 0, 1,..., m, et leurs dérivées partielles relativement à x, . . ., x{°) 
sont continues ue l’ouvert UJ ER X (R”7)°*1, tandis que les fonctions 
WiW—R,i—=0,1,..., m, sont continüment différentiables dans 


l’ouverrt WCER X (R")° X R X (R”)° ei supposons que x (-) € 
E CS (A, R”), i. î € int À vérifient 
G, 2(), ..., 20 (G)EV, 1EA; 
(és & (oh. 2670 (bo), Én Æ (us. SD (È))EW. 
Si Ë—(x(:), to, à) est une solution locale de rrcblème (1), (2), il 
existe des multiplicateurs de Lagrange à >0 pour le problème 
du minimum et ho LO peur le problème du maximum 


p(-)=(p1("), ….) Ps(-))EC1 (A, (R7)), À = (Ai: rues hn); 
qui ne s'annulent pas simultanément et qui vérifient 
a) les conditions de UE de la fonction de Lagrange: 


relativement à x(- rer y 0; Le ) = 0) 


PE) = fa (és 2(0, +, 29 (D) | 
à (6) = fun 6, 20), ., 29 (8) — pri ( on. (7) 
mas | 
O= futé (6, ..., 20 (4) — pe (), 
p; (3) =(—1} Lait k=—0, 1; (8) 
relativement à ty (£1, —0) 
BH (t)=(—144,, k=0, 1; (9) 


b) on a la condition de concordance des signes 
Mæ0, i=1,...,m; (10) 
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c) on a la condition de non-rigidité complémentaire 


À,P,(È)—0, i—1,...,m. (41) 
Ici 
ff zx, a, a) À f(E, x, ..…., a), (12) 
i—=0 
RO=Z O0 (TE 20, ...,20() (13 


et comme toujours 
LD So 20 (os Lo); .., LOT (los), das Ta), ..., CD (ti) 


etc., tandis que les inégalités (10) signifient que À, >0,siona 
&; (ë) L 0 dans le problème (1) et À, < 0 si on a PF; (Ë) > 0 dans 
(1) et enfin À; peut être de signe arbitraire lorsque %,; (£) = 0 
dans (1). 

Les détails des calculs qui amènent les conditions (7) à (12) de 
4.1.1 aux conditions similaires de ce théorème sont laissés au lecteur 
en guise d'exercice. 

Dans le cas particulier du problème à dérivées supérieures dans 
lequel les termes terminaux de (1’) et (2”) sont des constantes, les 
extrémités étant fixes, l’assertion du théorème peut être représentée 
sous une forme plus simple. Les conditions de transversalité (8) 
et (9) peuvent être omises, et le système (7) s'écrit sous forme d’une 
seule équation 


Enfin, si l’on stipule l’existence des dérivées nécessaires, l’équa- 
tion (14) peut s’écrire sous forme d’équation d’Euler-Poisson 


f de d > ds = 
Pa (fe fe (D (0) fo (D 0. (15) 
La solution générale de cette équation d'ordre 2s contient 2s 
constantes arbitraires et dépend aussi des nombres À,, . .., Am 


dont un peut être choisi arbitrairement. Ainsi nous avons à notre 
disposition 2s + m inconnues. Pour les déterminer, nous nous servi- 
rons de 2s conditions aux limites (pour les extrémités fixes) et égale- 
ment de m conditions obtenues à partir des conditions de non-rigidité 
complémentaire et des inégalités (1).et (10) (vérifiez que l’on en tire 
exactement m égalités). D’une manière analogue, on peut montrer 
que dans le cas général le nombre d'équations données par le théorème 
coïncide avec le nombre d’inconnues. 
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$ 4.2. Principe du maximum de Pontriaguine 


4.2.1. Enoncé du problème de commande optimale. Le problème 
d’extrémum dont il s’agit dans ce paragraphe est de forme presque 
identique au problème de Lagrange (1)-(3) de 4.1.1. Ici nous verrons 
à nouveau la même fonctionnelle, la même relation différentielle, 
les mêmes contraintes du type d'inégalités que précédemment. 
L'énoncé du nouveau problème diffère de l’ancien là où il présente 
séparément la contrainte sur la commande de la forme u (t) € 1, 
où 1 est un espace topologique. 

Au premier abord, ceci semble ne rien donner de nouveau et même 
paraît moins général. En effet, dans le problème de Lagrange, il 
s'agissait de la condition (#t, x(t), u(t)) € V que devaient satisfaire 
les processus admissibles. Dans le cas particulier où V — G X Y, 
nous pouvons séparer cette condition en deux: (f, x(t)) € G et 
u (t) EU. 

Toutefois la séparation des variables en variables de phase et de 
commande, et la mise en valeur des contraintes concernant la com- 
mande, s’avèrent particulièrement significatives. Dès lors nous 
avons affaire à une nouvelle branche de la théorie des problèmes 
d’extrémum, bientôt reconnue, grâce à son utilité pour les problèmes 
pratiques, par les spécialistes des mathématiques appliquées; en 
outre, tout ceci a permis de jeter un nouveau regard sur la théorie 
classique. 

Qu'est-ce qui explique cette situation? En premier lieu, c’est 
la nécessité d'étudier les problèmes à contenu technique. La sépara- 
tion des variables de phase et de commande et leur relation donnée 
par une équation différentielle est le modèle ordinaire pour un pro- 
cessus qui évolue selon les lois de la nature (équation différentielle!) 
tout en étant soumis à l'influence active de l’homme, qui commande 
ce processus à ses propres fins et essaie de le faire d’une manière 
optimale. Il est maintenant clair que les contraintes sur la commande 
de la forme u (t) € U sont liées aux possibilités limitées pour influen- 
cer le processus (par exemple, à cause de la rotation limitée des 
gouvernes d’un appareil commandé). 

Si nous prenons en guise de Ü un ensemble ouvert de R’, nous 
u’obtiendrons rien de neuf. Toutefois, dans les problèmes techniques 
et autres problèmes appliqués, l’ensemble 1 n’est pas nécessaire- 
ment fermé. Souvent la commande peut être tout simplement discrète 
(branché-débranché). Pour certaines contraintes naturelles il s’avère 
que Ù est un ensemble fermé: l’importance de ce fait a été notée 
en résolvant le problème de Newton (voir 1.6.2). Déjà dans les 
problèmes de commande optimale les plus simples, on rencontre des 
contraintes de la forme |u(t) | < 1 (voir le problème de temps 
minimal dans 1.6.3). Dans ce dernier cas, l’ensemble des commandes 
admissibles était une boule fermée dans l’espace L, (A), espace dont 
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la structure est assez compliquée, et dans des cas typiques la com- 
mande optimale est située sur la frontière du polyèdre jouant le 
rôle de cette boule, ce polyèdre étant particulièrement peu diffé- 
rentiable et « multiédral » ou plus exactement « infiniment-édral » ; 
il découle de ce qui a été dit dans 1.6.3 que le problème n'aurait 
pas de solution pour la contrainte | u (£) | 1 : le temps minimal est 
atteint pour une commande telle que | x (t) | — 1 presque partout. 
Tout ceci rend difficile l’application des méthodes usuelles du calcul 
différentiel, et les conditions de différentiabilité de la commande sont 
souvent fort peu naturelles. Par conséquent, nous n’allons plus 
postuler l’existence des dérivées f;,, p,, elc., et l’ensemble même 
des valeurs possibles de la commande sera envisagé comme un espace 
topologique quelconque qui ne possède pas en général de structure 
vectorielle. 

L'absence des dérivées relativement à w est la deuxième diffé- 
rence entre le nouveau problème et l’ancien. En voulant souligner ce 
fait, nous désignons les fonctionelles qui participent à l’énoncé du 
problème par une nouvelle lettre, quoique par la forme elles coïnci- 
dent avec les fonctionnelles de Boltz. 

Enfin, la dernière différence est le refus de postuler la continuité 
de la commande. Ceci est surtout lié au fait que le problème ne possède 
souvent pas de solution dans la classe des commandes continues 
(par exemple, dans la majorité des problèmes où U est discret ou 
dans le problème de temps minimal de 1.6.3). Il faut toutefois re- 
marquer que le passage à l’étude des extrémales brisées (ce qui 
correspond à une commande continue par morceaux) s’effectuait 
également dans le calcul des variations classique (voir 1.4.3). La 
possibilité même du choix libre de la commande à l’intérieur de l’en- 
semble Ü (dont nous nous sommes déjà servis en laissant apparaître 
les variations en aiguille dans la déduction des conditions de Weier- 
strass dans 1.4.4 et pendant la démonstration du principe du maxi- 
mum dans la situation la plus simple (voir 1.5.4)) engendre une con- 
vexité cachée de la commande, ce qui détermine la forme de l’hypo- 
thèse principale, du principe du maximum (voir (10), (11) dans 
4.2.2), qui rappelle alors l'hypothèse correspondante dans les problè- 
mes de programmation convexe. [ei cette relation ne sera pas complè- 
tement éclaircie, ce que nous ferons dans le paragraphe suivant, dans 
une variante plus particulière du problème général, il est vrai. 

Ainsi, considérons le problème d’extrémum 


Jott(-); u(-), to ts) — 
{1 


— | fo(t, x(t), u(t)) dt +Wo(tos to), tas t(tx)) — inf, (1) 


to 


z=plt, (8, ut), u()EU, (2) 
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l1 


Ji C) UC) to = VE (0, (0) dt+ 
to 
+1; (bo: & (Lo); l4, x (t1)) < 0, t— 1, 2: ..) M. (3) 


Icif;: GXU—R, v:W—R, i—=0,1,...,m,o:GX Ü —- 
— R*, où G et W sont des ensembles ouverts dans les espaces 
R X R'et R X R° X R X R”7 respectivement, et 1 est un espace 


topologique quelconque. Le symbole © a la même signification que 
dans les $$ 3.2 et 4.1. Toutes les fonctions f;, b;, @ sont supposées 
au moins continues. 

Le quadruplet (x (+), u (+), £o, t:) Sera appelé processus de com- 
mande pour le problème (1)-(3), si : 

a) la commande u (:): [t,, t,] — U est une fonction continue par 
morceaux. Ses valeurs aux points de discontinuité ne jouent aucun 
rôle ; pour fixer les idées, nous supposerons que u (+) est continue à 
droite pour t, <t<t, et à gauche au point £,; 

b) la trajectoire de phase de x (+): Léo, é,] — R' est continue et son 
graphique est contenu dans G: 


D = {4 rh <<} CG: 
c) pour tous les t € [t,, t,l, sauf peut-être aux points de disconti- 


nuité de la commande w (+), la fonction x (+) satisfait l’équation 
différentielle 


xt) = œ(é, x(t), u(t) 


(dans ce cas, nous disons que x (-) correspond à la commande uw (-); 
on voit facilement qu'aux points de discontinuité de la commande, 
x (-) possède des dérivées à droite et à gauche). 

Un processus de commande est dit admissible lorsqu'il vérifie les 
conditions (3). 

Un processus de commande admissible (x(-), ä(-), £s. t,) est 
appelé (localement) optimal s'il existe un nombre & > 0 tel que 
pour chaque processus de commande admissible (x(-), u(-), to, t:) 
vérifiant 


ile, k=0, 1, et |r(—r(l<e 
pour tous les 1€fts, t1]N Léo, 4] (4) 


an à l'inégalité 
REC) Ah DRAC) 0) (5) 


Remarquons qu'ici un changement par rapport au problème de 
Lagrange s’est produit : nous ne postulons plus le fait que les dérivées 


x (t) et x (t) sont proches l’une de l’autre. En calcul des variations 
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classique ceci correspond au passage de l’extrémum faible à l’extré- 
mum fort (voir 1.4.3). 

Il est utile de comparer le problème de Lagrange au problème 
de commande optimale pour le cas où U — R’'et V — G X KR’ dans 
4.1.1, avec l'hypothèse suivante: 

Chaque processus de commande admissible (x (+), u (+), £,, t;) 
du problème de Lagrange l’est également pour le problème de com- 
mande optimale (plus exactement, se transforme en celui-ci avec 
la contrainte de u (+) sur [£,, t.}). 

Cela signifie que le problème est devenu plus général (comparez à 
1.4.3). Par conséquent, la valeur du problème de commande optimale 
n’est pas supérieure à la valeur du problème de Lagrange (inf #, < 
< inf #,). Par ailleurs, pour des hypothèses assez naturelles con- 
cernant les fonctions f;, 14; et æ, ces deux valeurs coïncident (dans le 


cas trivial où x — u, nous avons déjà démontré ce fait dans le lemme 
sur l’arrondissement des angles dans 1.4.3). 

Lorsque inf 4, < inf #,, alors, comme on voit facilement, les 
solutions des deux problèmes peuvent exister ou non indépendam- 
ment l’une de l’autre. Si les valeurs des problèmes sont égales, un des 
trois cas suivants est possible: 


a) Le problème de Lagrange a la solution inf #,=#, (x (:), 


ut), ” +), dans ce cas, le même quadruplet est également 
la solution du problème de commande optimale, puisque 


Hot), u(.), to t)>infJo=int Bo=PBo((-), U(-), do bi). 


b) Le problème de Lagrange n’a pas de solution, tandis que le 
problème de commande optimale en a une: inf 4, est atteint sur une 


courbe différentiable par morceaux x (-). Nous avons eu l’occasion 


d'observer cette situation dans l’exemple (6) de 1.4.3 (pour x = w 
le passage de la classe CT à la classe XCT correspond justement au 
passage aux problèmes de commande optimale). 

c) Les deux problèmes n’ont pas de solution: la limite inférieure 
de la fonctionnelle n’est pas atteinte, même lorsqu'on élargit son 
domaine de définition. C’est le cas que l’on rencontre dans l’exemple 
de Boltz (1.4.3). 

_ Dans les raisonnements précédents, nous avons admis, sans l’in- 
diquer explicitement, qu’il s'agissait de la minimisation relativement 
à toute la classe des processus de commande admissibles. Toutefois, 
en considérant les problèmes d’extrémum, nous nous plaçons géné- 
ralement au point de vue local, ce qui, d’ailleurs, est reflété par nos 
définitions. Dans 4.1.1 le processus de commande admissible 


( th Cite: {.,) fut appelé optimal (dans le sens faible) s’il donne 
un minimum à la fonctionnelle #, dans un certain C1-voisinage 
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relativement à x (+) et dans un C-voisinage relativement à uw (-). 
Mais maintenant la définition de l’optimalité présuppose que le 
minimum 4, a lieu dans un voisinage plus vaste, décrit par les 
inégalités (4). En fait, c’est un C-voisinage relativement à x (+), et 
il n’impose aucune contrainte du tout sur la commande. Comme 
nous avons déjà remarqué dans le cas classique, il s’agissait ici du 
minimum fort. Par conséquent, une solution locale du problème 
de Lagrange peut ne pas être un processus optimal pour le problème 
de commande optimale. Si la commande à (-) est continue dans le 


processus optimal (x (-), à (+), t,, t.), alors, sous nos hypothèses usuel- 
les relativement aux fonctions qui participent au problème, ce 
processus sera également une solution locale du problème de Lagrange. 

Les contraintes (3) ne sont pas les plus générales qu'il faut consi- 
dérer en étudiant les problèmes de commande optimale. Nous lais- 
Pre par exemple, entièrement de côté les contraintes de phase de la 
orme 


(£, 6 4 (£)) € D, Lo < Î < Li; (6) 


où D est un certain sous-ensemble de R X R”. Bien sûr, si D est 
ouvert, alors, en remplaçant dans la définition du processus de com- 
mande G par G f} D et en prenant, s’il le faut, un e plus petit dans 
(4), nous aurons satisfait à la contrainte (6) automatiquement. Par 
conséquent, le cas le plus intéressant est celui où D n'est pas un 





ensemble ouvert et la trajectoire de phase 6ptimale x ({) sort, pour 
certains {, sur la frontière de D (voir figure 37, où il s’agit de mini- 
miser la longueur de la courbe et la partie hachurée du plan n’appar- 
tient pas à D). Ceci nous amène à des effets totalement neufs, en 
particulier à la nécessité d'introduire dans l'équation d’Euler- 
Lagrange une fonction généralisée, la dérivée de la mesure non abso- 
lument continue (ou remplacer cette équation différentielle par une 
équation intégrale avec intégrale de Stieltjes relativement à cette 
mesure). 
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4.2.2. Enoncé du principe du maximum. Principe de Lagrange 
dans le problème de commande optimale. Considérons à nouveau le 
problème 


l1 
Joe), UC) to = | HE 20, u (D) di+ 
to 
+ Vo (los (bo); das T(t)) + inf, (1) 
xt, z(i), u(t), u(t)EU, (2) 
l1 
JC) u() td = VE 20, u ©) di + 
to 


HW; (os To), ta, EH) SE O0, i=1, 2, ...,m. (3) 
Comme dans 4.1.1, la fonction de Lagrange de ce problème sera 
par définition la fonction 
1 
LC} u() tu hs PC), À o)= | L di+1, (4) 
to 
où 
10ER, À—=(l4, ..., Am) ERTÉ, 


L(t, x, x, u)— Mi, z, u)+p (0 (@—œ{t, x, u)), (5) 


m 


L (bo; Los Li; 2 À; (bo; Los L T4). (6) 


La fonction p (-):[és, ti] — R'* est supposée continue. Là où 
ce sera nécessaire, nous supposerons que p (+) est définie sur un 
intervalle plus large que lé,, t,] en la prolongeant en dehors de ce 
segment d’une manière arbitraire, mais de sorte qu’elle soit toujours 
continue. La fonction p (+) et les nombres À;, À, seront appelés 
multiplicateurs de Lagrange du problème (1)-(3), la fonction (5) est le 
lagrangien, (6) est le terminant. Enfin la fonction 


HE, UE, p)=L.z— L= p(t, D: u)— À;f;(t, x, u) (1) 
x i=0 


sera appelée fonction de Pontriaguine. Comme toujours, nous nous 
servirons des notations 


Las 


Li(D= Lt 2, 2, u(b), p=ep(, (0, u(b)), 
Lun = Len (or To): ta 2 (3), 


etc. 
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Théorème (principe du maximum de Pon- 
triaguine). Soit G un ensemble ouvert dans l’espace R X R”, 
W un ensemble ouvert dans l’espace R X RT X R X _. Ü un e pace 
topologique quelconque; les fonctions f;: GX U—R, i — 0, 1,... 

M, et p: G X U — RT ainsi que leurs dérivées Poil relative 
ment à x sont continues dans G X Ü, tandis que les fonctions \;: 
W—=R,i—1,..., m, possèdent des dérivées continues dans W. 

Si (x(-), à (+), to, t1) est un processus optimal pour le problème 
1)-(3), alors il existe des multiplicateurs de Lagrange 


0 >0, DC) À = (Au ver Ân)s 


qui ne s'annulent pas simultanément et tels que: 


a) on a les conditions de stationnarité et le principe du minimum pour 
la fonction de Lagrange: 


relativement à x (+) la condition de stationnarité (£,1.,= 0) 
d # # 
— LE. (D+£,0—0, (8) 
L.Gn= (0h k=0, 1: (9) 


relativement à u(-) le principe du minimum sous la forme de 
Lagrange 


LD=LÉ 50 020 min L (4 (9, 20, (0) 
1€ 


ou sous la forme hamiltonienne (la forme de Pontriaguine) comme prin 
cipe du maximum 


À (tb =H(t, z(t), u(b, P(D)= max A (4, (8) v, p(t)}, (11) 
VE 


la fonction À (6 étant continue sur le segment Fe ti] : 
relativement à t, la condition de stationnarité 


L,=0, k=0, 1; (12) 
b) on a la condition de concordance des signes 
k = 0; (13) 
c) on a les conditions de non-rigidité complémentaire 
TC), u(), ts )=0, i=1, 2, ..., m (14) 


(comme dans le paragraphe précédent, l'inégalité (13) signifie que 
À, > 0 si l’on a ÿ; < 0 dans la condition (3) ; À, < 0 si l’on a J, > 


> 0 dans (3) et À, est de signe quelconque lorsque Y; = 0). 
21—0237 
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L'’assertion sur l’existence des multiplicateurs de Lagrange qui 
vérifient l’ensemble des conditions a) à c) sera brièvement appelée 
ici principe de Lagrange pour le problème de commande optimale 
(1)-(3) ou principe du maximum de Pontriaguine. Comme précédem- 
ment, cette assertion correspond parfaitement au principe général 
de Lagrange énoncé dans 3.1.5. Puisque la fonction de Lagrange £ 
est une fonction de trois variables x (:), u (+) et (£,, t.), il faut consi- 
dérer trois problèmes 


(æ) LC ut) 4200) de M)esint, 
() 2e) at), DC): M) int, 
(+) LEC) 20) 0, 42 PO) Les taf 


Les problèmes (x) et (y) sont ici les mêmes que dans 4.1.1. Par 
conséquent, les conditions de stationnarité relativement à x (+) et 
t, y doivent être les mêmes que dans le problème de Lagrange, ce 
qui est justement le cas. En ce qui concerne le problème (B), c’est 
le problème élémentaire de commande optimale énoncé dans 3.1.4, 
et le principe du minimum (10) correspond exactement à la condition 
(1) de ce sous-paragraphe. Aïnsi notre formulation du théorème est 
en accord complet avec le principe général de Lagrange. 

On écrit généralement les conditions de stationnarité (8), (9) 
et (12) sous une autre forme : (8) comme l'équation d’Euler-Lagrange 
(que l’on appelle également équation duale) 


dt — 5 (D GO + Fin (0: (8e) 
(9) et (12) comme les conditions de transversalité 
Pts) + les = 0, —p (a) + dy = 0 (9a) 
et 
— À ()+k=0, À (bo) + ho =0. (122) 


Les transformations appropriées s'effectuent de la même manière que 
dans 4.1.1, il n’est pas nécessaire de les répéter. Aux points de dis- 


continuité de la commande il faut prendre la dérivée à droite Di (-) 
dans l’équation (8a) (celle à gauche existe également). La continuité 


de p (-)et Æ (-) aux points de discontinuité de la commande (ïi.e. aux 
points de cassure de x (-)) est connue sous le titre de condition de 
Weierstrass-Erdmann. 

Ici, on peut également effectuer l’analyse pour voir dans quelle 
mesure l’ensemble des conditions nécessaires exposées dans le théorè- 
me est complet. En fait, cette analyse sera la même que celle effectuée 
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pour le problème de Lagrange. Au lieu de définir w (+) comme une 
fonction de x (+) et p (-) à partir de la condition de Z,, = O0, il faut 
maintenant le faire en se servant de la relation (10). 


4.2.3. Variations en aiguille. Comme dans la situation la plus 
simple que nous avons étudiée dans 1.5.4, la principale méthode 
pour démontrer le principe du maximum, qui sera exposée par la 
suite, consiste à remplacer le problème de commande optimale con- 
sidéré par un certain problème d’extrémum de dimension finie, ou 
plus exactement par toute une famille de tels problèmes. Pour cela, 


A 


nous inclurons le processus optimal (x (-+), & (+), to, t,) dans une 
certaine famille de processus commandés — un « paquet » de varia- 
tions en aiguille — et considérons la restriction du problème (1)-(3) 
de 4.2.2 à cette famille. 

La famille de processus qui nous seront nécessaires dépend des 
paramètres suivants : 

données initiales (£,, xs), temps terminal t,; 

la suite finie & — (&,,..., an), où tous les &; € R sont suffisam- 


ment petits, par souci de brièveté, nous notons & — D: C; ; 

la suite finie t — (11,...,1w)}, OÙ LULU E... LTNw< 
<< 1,, les t; contenant tous les points de discontinuité de la commande 
optimale à (-); 

la suite finie v — (v,,..., vx), où v; EU. 

Par la suite v et v sont fixes, tandis que (£,, to, Zo, &) varient et 
ce sont les variables relativement auxquelles nous prendrons les 
dérivées de diverses fonctions. 

Supposons d’abord que V — 1. La variation en aiguille élémen- 
taire de la commande à ({) ou simplement « l’aiguille élémentaire » 
qui correspond à la paire (tv, v) se définit par les égalités 


___— »=À u(#, +élr, T+ a), ” 
V, tEIT, T+ a). 
D'une manière analogue, la variation en aiguille x (t; &,t,v) de la 
trajectoire de phase x (&) se définit comme solution du problème 
de Cauchy 
z=œpl{i, x, u(t; à, T, v)), 
| (2) 
x (T) = x (T). 
À une différence sans importance près (à la place de [t, t + «@) 
nous avons pris le semi-intervalle [t — À, t)), nous avons considéré 


une variation semblable dans 1.5.4. Nous avons découvert que la 
fonction x (4; œ, T, v) possède pour &« — 0 une dérivée à droite relati- 


21% 
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vement à & et pour { > + cette dérivée y (t) = x, (t; O, vw, v) est la 
solution de l'équation en variations 


y = Pa (6) y (8) 

à condition initiale 
y (T) = pt, x (r), v) — pr, x (x), u (r)). (4) 
En suivant 2.5.4, nous allons désigner ici et dans toute la suite 
du présent paragraphe par Q (é, t) la matrice fondamentale des solu- 
tions de l’équation (3). En outre, pour simplifier l'écriture, nous 


introduisons une notation spéciale pour le deuxième membre de 
l'égalité (4) : 


A@ (rt, v) = pr, & (rt), v) — p(r, z (r), à (x). (5) 
Dans ces notations 
y (6) = za (3 0, v, v) = Q (f, v) A (x, v). (6) 


Dans 1.5.4, nous nous sommes limités à une seule « aiguille ». 
Maintenant nous aurons besoin de tout un « paquet », puisque le 
problème est devenu plus compliqué, et il nous faut un plus grand 
nombre de paramètres libres. Dans un paquet, nous pouvons réunir 
un nombre fini quelconque d’aiguilles aux paramètres (x;, v;, @;), 
i—=1,...,N. Il est alors important de noter que certaines aiguilles 
peuvent différer seulement par leur valeur de commande v,, tout 
en ayant les mêmes +t;. Ainsi, nous ne pouvons plus donner les aiguil- 
les par les formules de la forme (1): pour des 7; égaux de différentes 
aiguilles peuvent se superposer les unes sur les autres. Pour éviter 


cette situation, nous déplacerons le semi-intervalle où agit la i-ième 
N 


aiguille d’un nombre égal à ia — i @;, de sorte que nous aurons 
4 j 


j—=1 
maintenant A; = Î[t; + ia, t; + ia + «;l. (Il est évident que si 
&; > Det les «; sont suffisamment petits, alors les À; sont disjoints.) 
En vertu des hypothèses posées dans 4.2.1, la commande optimale 


à (-) est continue à gauche au point À et à droite au point . Prolon- 
geons à (-) en dehors du segment [é,, {,] de manière continue (par 
exemple en posant à (t) = à (£o) pour é<tet à (t) = à (4) pour 


> t) nous effectuerons ce prolongement par la suite sans mention 
explicite. 

Supposons que tous les &; sont positifs. Définissons la variation 
en aiguille de la commande à (+) en posant 
x à x N 
u (£), l € (bo — Ô, l nu S)XU A, 
u(£; a, T, v)— 0 (7) 


N N 
v;, tEA;— LT; +i2 a Ti +i 21 a+). 
j= 3—= 
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La famille correspondante des trajectoires de phase z(£; to, to 
&, T, v) sera définie comme la solution du problème de Cauchy 


z=plt,z, ut: a, Tv), æ(é) =. (8) 
Pour simplifier, nous écrirons To = % (ts) par la suite. 

Lemme sur le paquet d’aiguilles. 1) Pour des 
Ep >> 0, Ô >> 0 suffisamment petits, la solution du problème de Cauchy 
(8) vérifiant 

éo— lol Len Ifo— ol Len 0 << (9) 
est définie pour Fi —0St<t +06. 

2) Si to + tp Lo + Lo et A; 40, alors x(t; Lo, Xo &, T, LV) —+ 
xt uniformément sur le segment [,, 4]. 

3) L’ application (us Los Los a) > Z(li5 lo To: &, T, v) peut 
être prolongée à une application définie et continûment différen- 
tiable dans un certain voisinage du point (ti, to, To, 0) de manière 
à avoir 

OxlOti = (t3 dos Tor D, Ts V)= (ts, tt), u(t))—p(é), (10) 
Oxl0to = to (£, : b; Lo: 0, T., v) = 


= — QG, &)p (Go Lo U (Go) = —R (Er, 0) Po), (41) 

xl 029 = Tr (413 dos To 0, % V)—Q (ty, to) (12) 
Oxl00y = Toy (ti3 Los Tor À, Tv) Q (y, do) AP(ta, vx), (13) 

où Q (£, t) est la matrice fondamentale des solutions du système d'équa- 


tions en variations (3) et Ao (t, v) est défini par la formule (5). 

La démonstration de ce lemme sera effectuée dans 4.2.6. II est 
clair qu'il garantit la différentiabilité des termes terminaux faisant 
partie des hypothèses du problème 4.2.2. En ce qui concerne les termes 
intégraux, ils nécessiteront, comme dans 1.5.4, un lemme particulier. 

Lemme sur les fonctionnelles intégra- 
les. Supposons que les fonctions f; (t, x, u) vérifient les mêmes hypothè- 
ses que dans l'énoncé du théorème de 4.2.2. 

Siul(t; &«, t, v) est défini pour a;>0 par les formules (7), 
tandis que x(t; to, To, &, T, v) est la solution du problème de 
Cauchy (8), alors les fonctions 


Fifi hr a) 
ï1 

— (25 to to, à, 7, v), u(E; à, v, vl)dt, i—0, 1,...,m, 
to 
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peuvent être prolongées à des fonctions continûment différentiables dans 
un certain voisinage du point (é., A To, 0) et l’on aura 
OPl0ti= Fins (br der To 0) = F5 Tr), u (D) =), (44) 
= — fi (los Tor U (to)) + Poi (£o) P (éo: Los U (Éo)) — 
= — ; (to) + Poi (to) P (to); (19) 
00% = Fixo (Ets Éos Tor 0) = Poi (to); (16) 
OF: 00 = Fa, (tir to os 0) — 


— Aÿ, (Ts Ur) — Poi (Ta) A? (Tr: Ur); (17) 
où Poi(t) est la solution du problème de Cauchy 


dpoi (D dr = — poi(t)Qu (Ts 2(T), U(D)+fix(r, 2(), (D), (18) 
Poi (4) = 0 
pour un système linéaire non homogène dual du système d'équations en 


variations (3), tandis que AÎ; (t, v) se détermine par une formule analo- 
gue à (5). Nous exposons la démonstration de ce lemme dans 4.2.7. 


4.2.4. Réduction à un problème de dimension finie. Le graphique 


de la trajectoire de phase optimale x (t) est situé à l’intérieur du 
domaine G et, en vertu de la deuxième assertion du lemme sur le 
paquet d’aiguilles (voir 4.2.3), le graphique de la solution 
x (t; Lo, Lo, &, T, v) du problème de Cauchy (8) du même sous-paragra- 
phe est également situé dans ce domaine pour t € [t,, t,l, à condition 
d’avoir les inégalités (9) de 4.2.3 pour un €, suffisamment petit. 
Par conséquent, le quadruplet (x (+: 6,, to, &, Tv), u (-; «, T, v), to, ti) 
est un processus de commande admissible pour le problème (1)-(35) 
de 4.2.2. 
Posons 


Y; (£1, Lor To» a) = 1); (Lo: Los Lt T (£; Los Tor A» T; v)), (1) 
ti 
F'; (Li, Lo: Lo) a) DE À Ï; (é, x(t; Lo: Lo) &, T, v}, u (£ ; a, T;, v)) dt, 
lo 
0; TL: M (2) 
En vertu de la troisième assertion du lemme sur le paquet d’aiguilles 
et d’après le théorème de superposition, les fonctions (1) sont continüû- 


ment différentiables dans un certain voisinage du point (cs _ Lo: 0). 
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Il en est de même pour la fonction (2) d’après le lemme des fonction- 
nelles intégrales de 4.2.3. 

Nous pouvons maintenant considérer le problème d'extrémum 
de dimension finie — la restriction du problème (1)-(3) de 4.2.2 à 
la famille des processus de commande construite : 


T, (é:, Lo To; a)=F (ta lo; Lo) a)+Y (21, Lo» To; œ) inf, (3) 

T ; (£4, Lo» To) a) =À; (£4 Lo: Lo) a)+Y, (£1, Lo» Lo) a) S< 0, (4) 
ER RC RE | 

a >0, k=1,2,...,N. (5) 


Pour ce problème, le point (ë. ” To, 0) est une solution locale. En 
effet, si l’on a les contraintes (4), le quadruplet (x (: ; fo, Zo, &, T, v), 
u (-; &, T, v), to, t,) est un processus de commande admissible pour le 
problème (1})-(3) de 4.2.2. Si le nombre e, dans les inégalités (9) 
de 4.2.3 est suffisamment petit, alors, en vertu de la seconde assertion 
du lemme sur le paquet d'aiguilles, nous avons les inégalités (4) 
de 4.2.1. 

Par conséquent, l'inégalité (5) de 4.2.1 est vérifiée, et l’on en tire 
TI, (£1, Lo: Lo) a) = 

= Jo(x(-; los Los À, T, v), u (:, œ;, T; v), Lo» 1) > 
>J (x (-), u (-), Los L1) = Î, (4, Los To» 0), 

ce qui signifie justement que ce to, To, 0) est une solution lo- 
cale du problème (3)-(5). 


En appliquant au problème (3)-(5) la règle des multiplicateurs de 
Lagrange du $ 3.2, nous obtenons l’assertion suivante. 

Lemme (méthode des multiplicateurs de 
Lagrange pour le problème de dimension 
finie auxiliaire). 1l existe des multiplicateurs de Lagrange 


lZ0, à = (Au SH hD)CR Te ui =: (lu, 6e Un); (6) 

qui ne sont pas nuls simultanément, tels que pour la fonction de Lagrange 
m N 

À (is or Toy % À, M) = 2: À; Fi+T)+ 2 1074097 (7) 


on a: 
1) les conditions de stationnarité 


=D lila + D Ai —0, (8) 
1—0 i+0 
A= D hat D Ma =0, (9) 
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m m 

À, rs > Mix “a > À Vire D 0, (10) 
i=0 i=0 

À, — 2 À E ion + 2 APR + Uz — 0, (11) 
1 i— 


où l’on a désigné AA = À «y (as Los Tor O5 À, LU, Ào), etc. ; 
2) les conditions de concordance des signes 


À; = 0, Ur SO ; 1,2, 7; k=—1, 2,...,N; (12) 


3) les conditions de non-rigidité complémentaire 


hilF; (8 Los Los 0) + V3 (85 Lo Tor = 0, (13) 
12:35 


4.2.5. Démonstration du principe de maximum. A l'exception 
d’un seul endroit, qui n’est pas tout à fait trivial, le reste de la dé- 
monstration est consacré au déchiffrage des conditions (8) à (13) 
de 4.2.4. Le principe du maximum proprement dit (ou, sous forme 
lagrangienne, le principe du minimum), i.e. la relation (11) (ou (10)) 
de 4.2.2, s'obtient alors des égalités (11) de 4.2.4, autrement dit, 


des conditions À, — 0. Chaque telle condition correspond à une 


des aiguilles qui font partie du « paquet » et si cette aiguille se déter- 
mine par la paire (t;, v.), nous obtenons l'inégalité 


FT (tn, (ta), Unes +) SH (tu, & (Te), À (tu), +). 

Aïnsi, pour obtenir le principe du maximum, nous devons passer en 
revue les aiguilles qui correspondent à toutes les paires possibles 
(t, vu), tandis que notre « paquet » en contient seulement un nombre 
arbitraire mais fini. La situation est sauvée par des considérations 
topologiques très simples, basées sur la compacité. En appliquant le 
« lemme sur la famille centrée », nous pouvons choisir des multiplica- 
teurs de Lagrange « universaux », valables pour l’ensemble de toutes 
les aiguilles. 

A) Existence des multiplicateurs de La- 
grange «universels». Etudions plus en détail les 
conditions (8) à (13) de 4.2.4 en y substituant les valeurs des dérivées 
des fonctions F; et Ÿ,, calculées à l’aide des deux lemmes de 4.2.3, 
et en prêtant une attention particulière aux termes qui contiennent 
les paramètres des aiguilles (7, vz). 

Les dérivées des fonctions F; sont données directement dans le 
lemme sur les fonctionnelles intégrales; si l’on désigne 


Air, v) = fi (x, a (0), v) — fi (x, x (0), à (D) — 
pos (t) Lo (tr, (rt), v) — p(r, x (r), à (D — 
Te Af; (T, ) — Poi (T) A (T, U), (1) 
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on voit que 
Fiay = Ai (trs Ur); 


alors que les paramètres des aiguilles n'apparaissent pas dans F;;,, 


Fi, Fix de Sorte que ces dérivées ont la même valeur pour tout 
« paquet d’aiguilles » de 4.2.3. D'une manière analogue, les dérivées 
des fonctions 


Y,; (£1, Lo» To) œ) = Ÿ; (Lo To) Li, T (£1; Los Los À, T; v)) 
se calculent à l’aide du théorème de composition et du lemme sur le 


paquet d’aiguilles, et seules les Ve. dépendent des paramètres des 
aiguilles. Si nous désignons 


Bi (x, v)= © L (or & Go), Es Z (En) X 


WT Dipir, zx), v)—p(r, z(r), u(r))] = 


= ir Q (1, D) A (, v), (2) 
alors 


nm 


Pics — B; (Ta Up); 


#n nm n" 
tandis que les valeurs des dérivées Ya,, Wi,, W;:. sont les mé- 
mes pour tout «paquet d’aiguilles». 


Nous avons maintenant 


na 


À (4 (Tr Va) + Bi(ta Uy)) + Une 


1—=0 


Puisque, d’après les conditions (12) et (11) de 4.2.4, on a y, LO 
et Â a, =0, on doit avoir les inégalités 


D À LA; (Tes Ur) + Bi (Tr: vr)] 20. (3) 


Considérons maintenant dans l’espace R(+9* les ensembles 
suivants : 


= {(à, o) | 2 Ÿ M= 1}, 


K (x, v)={(à, ) | ù (Air, v)+B;(r, v))2>0}, 
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Ti= {(A, do) | 2 À (Pie, + Vie) = 0), l=0, 1, 


À = {(A, ho) | > hi (Fe, ni Yix,) —. 0) Ù 


et enfin l’ensemble Z constitué par tous les (À, À,) pour lesquels 
À, > 0, tandis que À;, i — 1, ..., m, vérifient les conditions de 
concordance des signes et de non-rigidité complémentaire (12) et 
(13) de 4.2.4, conditions qui sont identiques à celles (13) et (14) 
de 4.22. 

Tous ces ensembles sont fermés, tandis que la sphère S est en 
outre compacte, étant un sous-ensemble fermé borné de l’espace de 
dimension finie R(m+1)#, 

Les conditions de stationnarité (8) à (10) de 4.2.4 correspondent 


aux inclusions (à, Ào) E T,;, Ts, À, les conditions de concordance des 
signes et de non-rigidité complémentaire, à l'inclusion (4, À) € Z 
{toutes ces conditions sont les mêmes pour tous les paquets d’aiguil- 
les). Les conditions (11) de 4.2.4, qui dépendent des aiguilles, sont 
vérifiées lorsque (À, ho) EX (tu, x), k = 1, , N. Enfin, puisque 
les multiplicateurs de Lagrange sont définis à à un coefficient de pro- 
portionnalité près et ne peuvent s’annuler simultanément, on peut 
les normer de manière à avoir (À, Ào) € S. Par conséquent, l’assertion 
du lemme du sous-paragraphe précédent signifie que 


N 
SNTARNANZN NN À (x V) ©. (4) 
Considérons la famille de sous-ensembles fermés 
Æ(rv)=SNTNTinXNnZNEk(v), 


TEl 4}, vEU, (5) 
de l’ensemble compact S. 
Lemme sur la famille centrée. La famille d'en- 


sembles K (7, v) possède une intersection non vide. 
Démonstration. D’après (4), tout nombre fini d'ensem- 

bles appartenant à Æ (t, v) possède une intersection non vide. Une 

telle famille d’ensembles est dite centrée. D'après un théorème bien 

connu [voir KF, p. 97], l'intersection d’une famille centrée de sous- 

ensembles appartenant à un ensemble compact est non vide. 
Ainsi on peut trouver 


Aide N ÆGv=SsNnnnTinxnzn N Æ(rv). (6) 


tEléo, dl: TEltos ti] 
veu EU 
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Ce sont précisément les multiplicateurs de Lagrange «universels». 


En effet, les À, ne s’annulent pas simultanément (GA, ko) € S), 
vérifient les conditions de concordance des signes et de non-rigi- 


dité complémentaire ((X, Ào) € Z), vérifient les conditions À, = 0, 
1=0, 1, et Ax,—0 ((à, Ro) EToNTaNX): enfin 
> Rd: (r v)+B;(r, v1>0 (7) 
i=0 
pour tous les TE [és 1, v EU. 
B) Démonstration du principe du maxi- 


m um. En substituant (1) et (2) dans l'inégalité (7), on peut la 
mettre sous la forme 


0 > À LAf: (t, 0) — po: (tr) A (x, v)]+ 
cs oŸ; 7 _ 
+ D LEO, +) AP (r, v)] = 
1—=0 


f(x, z(r), v)—f(x, x (r), u(r))— 
— pre (x, z(r), v)—@(r, z(r), u (r))] — 
—H(r, z(d, v, p(n)+H(r, z(r), u(r), pr), (8) 
ou 


f(x, x, u)— > À;f,(T, x, u), (9) 





#n Ô i 
p (t) = 2 ÀPo (t _S À al Q ( (és T) (10) 
i—=0 
est la solution de 1’ Éation d’Euler-Lagrange (8a) de 4.2.2, comme 
nous verrons par la suite, et 
H (r, x, u, p) = pq (rt, x, u) — f (rt, x, u) (11) 
est la fonction de Pontriaguine (comparer à (7) de 4.2. 2). 


L'inégalité (8), qui est valable pour tous les x € fo t.] etvE Ù, 
est équivalente au D du maximum (11) de 4.2.2 


H(r, z(v), u(r), p(r)=max/Æ(r, æ(x), v, p(r). (12) 

C) Démonstration des conditions de sta- 

tionnarité relativement à æx(-). En prenant la 

dérivée de (10) et en se servant du fait que p,; (xt) vérifie les équations 
(18) de 4.2.3, alors que 


Q (é, a 
LG LQ(4, 5 0.(0 
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(voir le théorème de 2.5.4), on obtient 


dp(x)/dr= D À; {— pos (1) Px (T) + fix (T)} + 


i—0 


3 


Led 








Ro Gin. (= 

1—=0 
= —p(r) Pa (D + D fie (T) = —p (7) Pa (0) + fx (7), 
i=0 


1.e. p (-) est la solution de l'équation d’'Euler-Lagrange (8a) de 4.2.2. 
Ensuite il découle directement de (10) que 





ô; Ge 
5 @= D pa Éd D he ee Q (En à) = 


i—=0 i—=0 


=), À, 43 
1 


puisque Po (£,) — 0 d’après (18) de 4.2.3, tandis que Q (f, t) = E 
Ici, de même que dans (6) de 4.2.2, l'expression 


m 
L (bo: To; La a) = 2 he (Lo: To Li T4) (14) 


est le terminant, tandis que l'égalité (13) obtenue est équivalente à 
la première des égalités (9a) de 4.2.2. 


Enfin la condition À, — 0, i.e. (10) de 4.2.4, nous donne, après 
substitution des valeurs des dérivées (12) et (16) de 4.2.3 


m m 
0= Aa, = > ll io + > Mix — 
i=0 1=0 
m . m da 
= — >, ÀiPoi (do) + DE à (Pix + Vies ue . Je 
i=0 i= 
si D À Po: (£o) + > his, de D Aix: Q (a, to) … 
i—=0 î= i=0 


— ep (to) LE le 


de sorte que la deuxième condition de transversalité (9a) de 4.2.2 
est également vérifiée. 
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D) Démonstration des conditions de sta- 
tionnarité relativement à ‘©. En substituant 
les valeurs des dérivées (10), (11), (14), (15) de ‘4.2.3 dans les con- 


ditions Ày, = À, = 0 [(8) et (9) de 4.2. 4], nous obtenons, en nous 
servant des notations (9) à (11) et de l'égalité (13) déjà démontrée 


OA fu + D hs Vie, — 


nr &+S À [ Die + Pie, 5 te Ÿ (ba) + Des + Da @ (a) = 
i=0 i=0 


— ÿ (43) — p (4) p (és) sa Li, — — À (#1) + du 


et 


0 — À, = ÿ À Pie, —- S! re Va, — 
i=0 i=0 


= S' ,[—f; (0) + Poi (£o) P (Co)l + 
1—=0 


mn 


ne S À Lite + Pics + | = 
i=0 


= — ÿ (&)+ 3! Ripor (Go) 9 (0) + de + Le L-—@ (Es 0) P (o)] = 
i=0 
= — À (bo) + P Go) P (0) + de = À (0) + br 
Ainsi nous avons démontré les deux formules (12a) de 4.2.2. 
E) Continuité de la fonction A (:). De même 
que la commande à (t), la fonction 
À ()=H(, 2(t), u(), p()= 
= —f(4 z(), 4(D)+PO(E z(), u(D)= 
m 
= —2 Mie 2, uG)+r OP, x, u(E) 
est continue à droite. En outre, chacune des fonctions Æ (#, x (é), 
V, p (t)) est continue relativement à t et, si l’on passe à la limite dans 
l'inégalité 
H(6, z(6), v, pO)SH(, 7, u@, POH)=A@, (15) 
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on obtient 
H (x, x (r), V, PE Liu À (= = À (x— O), 
d’où l’on tire 


À (x) 2 H(x, (ri), v, p(n) LA (T—0). (16} 


D'autre part 
À (m—0)— lim A ( x(t), u(t), p(t))— 


=H(r,z(r, u(r—0), p(d)= lim AH(r sr), v, p)< 


Tæu(T—0) 
<H(r, z(t), u(T), p(D)=À (1) 
en vertu de la même inégalité (15). En comparant avec (16), on 


obtient À (t — 0) — À (t), i.e. À (+) est également continue à 
gauche. M 


4.2.6. Démonstration du lemme sur le paquet d’aiguilles. Rap- 
pelons que la variation en aiguilles x (t; to, ïo, &, T, v) de la trajec- 
toire de phase optimale T (-) est la solution du problème de Cauchy 


z= pt, z, u(t; &, T, v}), (1} 
(Lo) = Los (2) 


où la variation u(f; &«, t, v) de la commande optimale w(t) se 
détermine à son tour, pour a; =>0, à l’aide des formules 


V;; tEA;=[T;+ia, T+ia+;), 


a. T. v)=— ) N k 
| u(ti), t4U A;; a—= >) aj. @) 


Il est commode de diviser la démonstration du lemme sur le paquet 
d’aiguilles (le lemme de 4.2.3) en deux parties. La première, que 
nous énoncerons sous forme d’une assertion séparée, consiste à dé- 
montrer la convergence uniforme des trajectoires de phase après 


variation à la fonction x (-). Ce n’est pas la continuité par morceaux 
de la commande qui joue ici le rôle essentiel, mais la convergence 
intégrale des deuxièmes membres correspondants des équations de 
relation différentielle (voir la formule (5) plus loin). Pour le souligner, 
nous généralisons notre assertion aux commandes mesurables (en 
définissant d’abord d’une manière appropriée la notion de mesurabi- 
lité dans le cas où les commandes prennent leur valeur dans un espace 
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topologique quelconque). La deuxième partie de la démonstration 
du lemme sur le paquet d’aiguilles est directement liée à la con- 
tinuité par morceaux et se base sur le théorème classique affirmant 
que les solutions d'équations différentielles dépendent différentiable- 
ment des données initiales. 

Définition. Soient lÜ un espace topologique quelconque et 7 
un intervalle fermé de la droite réelle. L'application u: Z — Ü est 
appelée mesurable (dans le sens de Lebesgue) s'il existe une suite 
finie ou dénombrable de sous-ensembles À, mesurables disjoints 
telle que: 

a) la restriction uw | 4, se prolonge à une fonction continue sur 
l’adhérence À, ; 

b) IX U À, possède une mesure de Lebesgue nulle. 


n 

Il est clair que chaque application continue par morceaux est 
mesurable dans le sens de cette définition (en guise de À, il faut 
prendre les intervalles de continuité). [Il est presque aussi évident 
qu'une fonction mesurable dans le sens de cette définition l’est 
également dans le sens usuel, quand H G R'IKF, chapitre V, $ 41. 

En effet, soit u, (+) une fonction continue sur À, qui coïncide 
avec u (-) sur A,. En posant uw, (t) — 0 en dehors de À, nous obte- 
nons une fonction mesurable sur R. La fonction caractéristique 
XAn (-) de l’ensemble À, est également mesurable et, puisque l’on 


a u(t) — ÿ Y%an (t) Un (t) presque partout sur J, la fonction w (t} 


n 
est mesurable elle aussi. 


Exercice. Démontrer que si Uc R’et la fonction u: I + U est 
mesurable dans le sens usuel de Lebesgue, alors elle est également mesurable 
dans le sens de la définition donnée ci-dessus. Indication: Servez-vous 
de la propriété (C) de Lousine ([KF], p. 284). 


Dans l’énoncé du lemme suivant, % est un espace topologique 
de Hausdorff [KF, p. 891. 


Lemme 1. Supposons que les fonctions @ et œ, sont conti- 
nues dans GX, x: [to, t4] —R" est la solution de l'équation 
différentielle 

æ—œp(#, x, u(i)) (4) 
et son graphique L ={(, x (t)) | hLtLt} est contenu dans G. 


Supposons ensuite que O0 et us: (to —09 14 + 0) > Ù est 
une famille de commandes mesurables telle que pour tous les t et 
tous les GE les valeurs u,(t) sont contenues dans un certain 
compact oc. 
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Supposons enfin que u (= u. (£) pour un certain GEU et 


ti+00 
im | Ip, 2), ue ()—p(é, 20), U(H)1&=0. (5) 
(° L70 2 T0 


Alors les solutions X, (t, to, xo) du problème de Cauchy 
8 
t=p(é, x, ua (t)), & (to) = Lo 
pour un certain 0 sont définies sur l'intervalle fermé 
[to—Ô, ta —Ô] pour tous les (l5, x», &) provenant d'un certain 
voisinage du point (to, æ(to), &) dans R X R° XYA\ et pour 


tt, To — Lo (to), œ—+>œ on «a 
X « (£, Los To) + x (1) 


uniformément relativement à £ Elfe, t,]. 


Démonstration. Appliquons au cas considéré le théorè- 
me 2 de 2.5.5 en posant 


Fa (£, t) — (é, T, Ug (£)). (6) 


A) Si les À, sont les ensembles dont il s’agit dans la définition 
de la mesurabilité appliquée à w,, (+), alors pour un x fixe les fonc- 
tions {— @p (é, x, u, (t)) sont continues sur À, et, par conséquent, 
tr F, (t,x) sont des fonctions mesurables, l'hypothèse A) de 2.5.1 
étant remplie. Pour t fixe, les fonctions F, sont différentiables relati- 
vement à x en même temps que ®, de sorte que l’on a également l’hypo- 
thèse B) de 2.5.1. 

B) Pour chaque compact &# & G, les fonctions @ et æ, sont con- 
tinues sur le compact # X &#', et donc bornées. Désignons 


M= max [œ(i, x, u)|, M,— max [|q.(i, x, u)||; 
ÆAXH AXE) 

nous voyons que l’on a l’hypothèse B”) du théorème 2 de 2.5.5 avec 
x (t) = M et k(t) = M,, puisque par hypothèse u, (t) E&o La 
condition D) de ce théorème coïncide avec (5). 

Ainsi dans la situation envisagée le théorème 2 de 2.5.5 est 
appliquable, or il implique l'assertion à démontrer. 

Démonstration du lemme sur le paquet 
d'aiguilles. 

A) Vérifions les hypothèses du lemme précédent. Celles qui se 
rapportent à ® et x (-) font partie des conditions du théorème sur le 
principe du maximum. 
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Ci-dessus nous avons déjà supposé que la commande u(:.) 
a été prolongée en dehors du segment [é,, CAE de sorte que pour 
t<t et pour tt, c’est une fonction continue. Nous supposerons 
donc par la suite que u (-) est définie sur le segment A = [ty — 89, 
HOT 00, et ses points de discontinuité sont situés dans 
l'intervalle ouvert (te. F3). 
Supposons que HD LD SL... Li sont ces points (0) — 
RS de — +60. La fonction 
Fe AS 
u;(t)=A À, 
u (#® — 0), ei" 
est continue sur le segment Z; — [t-D, 4G)] et l’image €; de ce 


segment par l'application continue u;:.1 — WU est compacte dans Ü, 
puisque J; est compact. En vertu des formules (3), les valeurs de la 


es 


commande uw (t; &«, T, v) sont situées dans le compact 
s+1 
A 9 = U, A ; U {us .….., Un}. 
1—= 


Il reste à vérifier la condition de convergence intégrale (5). Sur 
le compact 


={(#, z(t), u)|ÉEA, UE} =T x #0 
la fonction continue est bornée: | | < M. Pour des a; > 0 si 
petits que les semi-intervalles A; ne se coupent pas, nous obtenons à 
partir des formules (3) la relation 
Li4+60 
| lp zut; a, 7, v))—@(é, z(t), u(#) | dt 


Lo — Oo 


N 
=D [lot 20, v)—p( 20, 2H) 1a< 
A 


N 
j=1 
avec &; | Ü, de sorte que la condition (5) est satisfaite. 


En appliquant le lemme 1, nous voyons que les deux premières 
assertions du lemme sur le paquet d’aiguilles de 4.2.3 sont valables : 


pour un €, >> O suffisamment petit, la solution x (#: és, to, @, T, 
du problème de Cauchy (1), (2), avec (t,, zo, &) vérifiant les inégalités 


22—0237 
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(9) de 4.2.8, est définie sur À = [é, — 6, &, + ô] (première assertion), 


et avec Lo —- _. Lo > To, X; \ 0, 
c(t5 to Tor À D D) +2 (6) 


uniformément par rapport à £€ Li ] (deuxième assertion). 

B) Passons maintenant à l'étude de l’application (44, to, To, &) —+ 
— Z(ti5 to @, T, v). Désignons comme toujours par X(£, £o, xo) 
la solution du problème de Cauchy 


tr 0), 2) (7) 
D'après le théorème 1 de 2.5.5, la fonction X (+, «+, :) est définie et 


continue dans le domaine ( OO) G, où Gest un certain 


voisinage du graphique F de la solution x (+). Si l’on restreint le 
domaine de définition de manière que {, et t ne puissent prendre des 
valeurs égales aux points de discontinuité #® de la commande à (:-), 
alors l’équation différentielle dans (7) vérifie les hypothèses du 
théorème classique sur la dépendance différentiable de la solution 
des données initiales (voir 2.5.7), de sorte que X (é, to, to) Sera une 
fonction continâment différentiable relativement à l’ensemble de ses 
variables. En particulier X est continûment différentiable dans cer- 


tains voisinages des points (1x, {», æ (t4)), puisque dans certains voisi- 


nages des points tr, la commande à (-) est continue en vertu de nos 
hypothèses. 


Désignons ensuite par E(Ë, &,T,v) la valeur, pour RE 
de la solution du problème de Cauchy pour l'équation (1) à con- 


dition initiale x (to) <Ë, il. €. 
B(E, à, t, v)—x(bai for Ës @, 7, v). (8) 
D’après la formule (13) de 2.5.9 et les formules (3) qui déter- 


minent la commande u(f; &,T,v), on a 


x (1; Lo) Lo; œ, T, )= ZX (fi, La E(X (do: Los Lo); &, 4; v)) (9) 
(de #, à : nous trouvons la solution de l'équation x = o (£, x, u) 


avec la commande w = à (t), ensuite de t, à t, avec la commande 


u = ut; «&, T, u) et, enfin, de 2 à t, à nouveau avec la commande 
u — à (t)). Il est à noter que, de même que la formule (13) de 2.5.9, 
la formule (9) est valable pour toute disposition des points t; relative- 


ment à l;. 


$ 4.2] PRINCIPE DU MAXIMUM DE PONTRIAGUINE 339 


Si nous pouvons maintenant prolonger l'application (E, &) — 
> E (Ë, &, Tv, v) à une application de classe C! définie dans un certain 


voisinage du point (x (£5), 0) (i.e. nous pouvons la prolonger aux 
valeurs négatives de &; en conservant la continuité de la dérivée), 


alors, d’après la formule (9), l'application (1, to, xo, a) x (t,; 


Los Tor &, T, L) Sera prolongée également à un certain voisinage du 
point (é,, , ïo, 0) et, en vertu du théorème de 2.2.2, elle sera conti- 
nüment différentiable, étant la composée de trois applications conti- 
nûment différentiables : 

(or Lo) 7 À (los Los Lo), (E, a) EE, à, t, v), (t, No) À (bas fa, No): 


C) Soit Tt € (ko, t,), supposons que v €, U sont fixes. Désignons 
par Ÿ, (é, to; Yo) la solution du problème de Cauchy 


y = œt, y, v), y (to) = Yo (10) 


En vertu du théorème d'existence local (voir 2.5.2) et du théorème 
classique sur la différentiabilité des solutions relativement aux 
données initiales (voir 2.9.7) Y, (t, to, Yo) est définie et continüment 


différentiable dans un certain voisinage du point (x, v, x (t)). 


Si test un point de discontinuité de la commande u (-), 1.e. 
u(t—0)-£u(t), nous envisageons en plus de w(:) la commande 


= ? = 
= {70 Fo. 
U(T), ET. 
Puisque u (: -) est continue dans un certain voisinage du point ft, 
la solution Ÿ (4, Lo Zo) du RÉAL de Cauchy 


x = = px, u u (t)), (bo) = Lo (11) 
est également définie et continüment différentiable dans un voisinage 


du point (t, T, x (t)). Mais si t est un point de continuité de à (-), 
alors X (é, to, to) elle-même possède la même propriété, et dans les 


Le. "2 


formules qui suivent on peut supposer que À = X. 

Ajoutons à la famille & = (t,, ..., tr) les points t, — A et 
TN+1 = Lt, de sorte que to = = GE TR see LT EE TvEr = t.: 
envisageons la composée des applications 

5 (£, &, T, v)=PoXyoZro ...0XpoZpoXz y0...0Z10 À, (12) 
où P(E, a) = EË, 
Xa(E, à) = (X (Trtu Ti Ë), à) (13) 


22% 
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et 
Zi (8, a)—(X (ts Tathatar, Yo, (tm +ha+a,, 7T+ka, 


X (ty +ka, tu, Ë))), &). (14) 

Puisque X, et Z, sont continûment différentiables dans un voisinage 
du point pr — (x (tx), 0) et de plus X4 (px) = Pr+1 Zr (Px) = Pa, 
tandis que P est linéaire, la composée (12) est définie et continûment 
différentiable dans un voisinage du point p, — (x (ko). 0) — (Ze, 0). 
Lemme 2. Si tous les ay; > 0 sont suffisamment petits, alors 


BE, at 0)—E(E, a, t, v)—æ(éis to Ë, @, Tv). (45) 
‘Démonstration. Désignons plus brièvement x(f) — 
= L(lS £, «, T, v). Si tous les «y, >> 0 sont suffisamment petits, 
les semi-intervalles A; qui font partie de la définition (3) sont dis- 


joints deux par deux et situés entre les points £, et é, en ordre crois- 


sant de numéros. 
N 


Soit s;—T;+ia—Tt;—+i ), «; l'extrémité gauche du semi-inter- 
j=1 


valle À;, So = To = los SnN+1—=Tn+1— {4 Démontrons par récurrence que 


T (sx) — À (Sz, Tz; Gr) (16) 
où Ep —= & et 


En — Po Xp Zru0 Xn-2o...0Z10 Xo (E, æ), k>1; (17) 
en particulier, Ë£, = Po X,(É, a) — X (ty, To, E). Puisque pour 


L, = To Lt LS, les équations différentielles de (7) et (1) coïncident 
et x (to) = E = X (To, To, E0) nous obtenons x (t) = X (f, to, Ë)) 
dans ce semi-intervalle ; si l’on passe à la limite pour ts, en 
tenant compte de l'identité 

X (81, To: 60) — À (S13 T1 À (T1, Tos 60): 
on obtient (16) pour k£ = 1. 

Supposons maintenant que (16) est vérifié pour un certain k. 
Pour passer par la solution x (+) de s, à s,+.,, il faut, en vertu de (3), 
procéder de la manière suivante. De s, à 2 + ox, il faut trouver la 
solution de l’équation (10) avec v = v, et la condition initiale 
Yo — * (sx), obtenant. ainsi x (s, + ax) = Y,, (Sn + Gn; Sn: æ (sx)). 
Ensuite, de s, + ax (i.e. de l’extrémité droite de A;) jusqu’à 5:+: 
(l'extrémité gauche de Az+,), nous trouvons la solution de (7) à 
condition initiale x, — x (s, + ax), obtenant l'égalité 


Z (Sn+1) = À (Sn+1s Sn + An, (Sr + Qn)) — 
= À (Sz+1, Se + Fe (SR + Gr, Sn T (Sx)). 
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En vertu de (13) de 2.5.5, on a l'identité 
Xe A tn Lex ls Li) 
En se servant de cette identité et de (16), valable par hypothèse de 
récurrence, on obtient successivement 
T (Sr +1) = X (Sx+1; Tz+1) X (Ta+1 Th X (Ta SR ua Œx 
x (Sa au a)))) = À (Sa +1 Th +1) X (Ta+1s Tzo X (Te; SR GE ŒR 
Ve, Ga + an, Se, X (sn we, Er). (18) 
Remarquons maintenant que si tous les «4, sont positifs, alors 
Th Sp LS + On, et Comme pour { > Tz les équations (7) et (11) 
coïncident, on a X (Ts, Sn + ap, Ë) = X (Tr, Se + Gp, ËE) et 
X (Sp, Th: 8) — X (s2, Tr, 62). Par conséquent, en utilisant d’abord 
les définitions (13) et (14), et ensuite (17), nous obtenons 
À (Titus Tr À (Ts Sh + On Yo, (SR + On: Shs 
X (sx, Tr, 6n)))) = Po Xp 0 Zn (Ex, à) — 
= Po XpoZgo Xpuo...o X5(E, &) — Ep. 
Ainsi (18) coïncide avec l’équation (16) dans laquelle k est remplacé 
par 4 + 1, de sorte que (16) est démontré pour tous les 4 > 1. Il 
ne reste qu'à noter que (16) se transforme, pour k — N + 1, en 
égalité 
Z(t) = À (1, d, Énr1) = nu — L 
=PexXne retro Xe. a) =E (Er, 2) 
(la dernière relation découle de (12)) et, puisque par définition 
t(t)—#©(Ë, à, Tv, v), la relation (15) est démontrée. 

Comme nous l’avons déjà remarqué, la composée (12) est con- 
tinüment différentiable dans un voisinage du point (Co, 0). Par 
conséquent, Æ(£, @,T,v) (qui avait précédemment été définie 
pour à; 5 > 0) possède un prolongement continûment différentiable 
à ce voisinage. En vertu de B), il en découle que z(ti; to, Zo 
&, T, v) possède (pour des T, v fixes) un prolongement continû- 
ment différentiable à un voisinage du point (és, :. To, 0). 

Il ne reste qu’à démontrer les formules (10) à (13) de 4.2.3 pour 


les dérivées partielles de cette fonction au point (é1, . Lo, 0). 
D) Remarquons tout d’abord que 


tt; lo To 0, 7, v)=X(t, to, to), (19) 
cé: to Zto) 0, 0=X(é, to t(to))=t(t), (20) 


x (5 Lo Tor GT, V)æ E (ay, @, T, D). (21) 
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En vertu de (19) et (21), la dérivée partielle relativement à x, peut 
être trouvée en appliquant le théorème de 2.5.6 











Ox … , “= e Lin ee 0E (To, 0, T', D) 
0 Ga, (15 Los Tor 0, T, v) Fe Cp += 
XX (10) X o—=X(L0) 
oX 1 , " T PS #n s 
= — ( de 0 o) ne — Q (£1, Lo)» (22) 
° xo=%(È0) 





où Q (ft, t) est la matrice fondamentale des solutions de l’équation 
en variations 


2= Qt, 2 (6), u (E))z 
(dans la formule (2) de 2.5.6 il faut poser F (t, x) = œ (t, x, à (t)) 
et se servir de (20)). Ainsi, la relation (12) de 4.2.3 est démontrée. 


Servons-nous maintenant de la formule (9) en remarquant d’après 
B) que les dérivées de la fonction X (t, t,, x) peuvent être calculées 


dans un voisinage des points (tn, tr, æ (t»)), k = 0, 1, à l’aide du 
théorème classique sur la différentiabilité relativement aux données 
initiales (formules (3) à (6) de 2.5.7, dans lesquelles on a à nouveau 
posé F (4, x) — œ (t,x, à (t)). En prenant la dérivée de (9) et en tenant 
compte de la formule (22) déjà trouvée et du fait que d’après (20) 
et (21) 


RENE ARS 
x (ba: 


on obtient 
Oxl0t, = OX (ta, ta à (és) )/t4 = p (tx, æ (ta), u (bi), 
Orloty= 08 (E, 0, v, vy/OE], La 0X (for to), 


Gen, 2 0 6, 010 du 208 


Ceci démontre les relations (10) et (11) de 4.2.3. 
Supposons maintenant que à; = 0,i-£ket ay, > 0. Désignons. 
pour simplifier 


TANT L. x (bo); (Oise 00... AU) Tv). 
Pour un tel choix de «&, en vertu de (3), les équations différen- 
tielles (1) et (7) coïncident dans le semi-intervalle << Ty + 
+ ka, et l'on a x(ts, ax) —x(t,), donc, dans ce même semi-inter- 
valle, æ(t, a;)=æx(t); en passant à la limite, on obtient 


L(Ta + AO, @) — x (Ta + ka). (23) 
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Ensuite pour t, + ka <'i< Tr + kax + à, on trouve la solution 
de l'équation différentielle (10) à condition initiale (23) et avec 
vu — Ur, d'où l’on tire 
x (Ts + ko + ax, ax) — 

=, (ta + ho + ou, Ta + kax, x (tx + ka). (24) 
Dans l'intervalle restant t%, + (k+1)a <it< Le nous faisons 
de nouveau appel à l’équation (7), mais maintenant avec la donnée 
initiale (24). Nous diviserons cet intervalle en deux en fixant s de 
manière que l'intervalle (t;,, s) ne contienne pas de points de dis- 


continuité de à (-). La valeur de az >> 0 sera supposée si petite que 
l’on a Ti << 7x + (k + 1) ay Ls. Alors 


2 (hi, a) = X (1,5, x (s, ax)) — 
= X(,s, X(s m + (+1) a, x (re + (k + 1) an, ax))) — 
= X(h,s, X(s, mù + (+1) on, Va, (te + (4 + 1) an, Te + 
+ kon, & (Ta + kax))). 


En calculant la dérivée de cette formule, il faut prendre en considé- 
ration les égalités suivantes: 





OX ,T = A 
Ôto (é1, 5, Lo) |xi=x(s, 0)=%(s) = Q (Er, S) 
(voir (1) de 2.5.6; #, et s sont fixes) ; 
Ô0X 
ôte (s, lon T (Th O)) =, Fe — Q (s, Th) ® (Tr: c (Te), ü 4 (Tx)), 


0X DE 

FA (s, Th To) he 0)=R(T },) — Q (s, Th) 
(voir (9) et (6) de 2.5 7 ; le théorème classique est applicable, puisque 
sur le segment [7,, sl la commande à (-) est continue et t, << Tr + 


Ed) Ses) 





2 (%3))ltmer, = D (Gas © (Ta), Va), 


VB rs ES 
dt, (Trr Los L(Tx)) tot, = — P (Tr: TZ (Tr), Ur); 
pt 
(Ta) To Yo) = E£ 


(dans les formules (4) à . de 2.9.7 il faut poser F (£, x) =  (é, x, vx) 
et prendre en DONSIAÉEARIOR le fait que toujours Q (é, &) — EE); enfin 





x (T) = p(w, à x (tr), à (t:)) découle de (7). 
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Ainsi, 
FE, als = 
(5 cola {PET ECO) (+ 1) + 
OU OUI AU EICUICENE, 
Fées me EC) #4 (rs vu 2 Ce) 2 (mn) #]} = 


O (bi, s){—Q (8, to) 9 (tn: & (ta), U (tx) (4 +1) + 
+Q (s, Ta) [ (Tes 2 (Ta), va) (4 +1) — (tx, & (te), Va) + 
+ p(ta, & (Tr), u (tx) k]}= 
—Q (4, Ta) [o (ts, (te), 02) — (ta, (ta), u (m))]. 


ce qui démontre (13) de 4.2.3 ; l'égalité Q (4, s) Q (s, %) = Q (Ë, %) 
a lieu d’après la propriété principale de la matrice fondamentale 
(voir (11) de 2.5.4). 


4.2.7. Démonstration du lemme sur les fonctionnelles intégrales. 
ue È a (0: É1 ns nil (fo f1 rs Îm): F — (Fo Fi, ee 


Fm) (les fonctions F; sont définies dans l'énoncé du lemme dans 


—… = 


4.2.3), u (t; a, t,viet x (ft; to, os &, T, v) ont la même signification 
que dans les sous- -paragraphes 4.2. 3 et 4.2.6. 

Envisageons pour a; >> 0 le problème de Cauchy pour le systè- 
me d'ordre (n + m + 1) 


sf )-e 2, E,u(t av = PÉpR 0 ) ] (1) 
Ë f(x, ut; a ) 
2()=% El) =0 


Ici, les équations pour x ne contiennent pas & et coïncident avec 
(2), 4.2.6 ; x (3 to, To @&, T, v) est donc leur solution, alors, comme 
on voit facilement, 


F (tas Los Los a) = E (l15 dos To dt, 0). 


Par conséquent, la possibilité de prolonger cette fonction aux valeurs 
de «, non positives et la différentiabilité continue dans un voisinage 


de (#., Le. Lo, 0) découlent du lemme sur le paquet d’aiguilles appliqué 
au système (1), tandis que les valeurs des dérivées s’obtiennent des 
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formules semblables à (10) à (13) de 4.2.3: 


La 


0x = 7 0x He = ER 
—= P (£1), dt — — 2 (4, to) P (to); 





(2) 


La La 


Ôx rs x re. = 
ne = (2 (41, to), Go = (é Ta) AP (tx; Ux); 
To 


Gr Go 
Q — 
Ee Fa a 


est la matrice fondamentale des solutions du système d’équations en 


variations 
= ()-60 G) (3) 
6 UNE 


(Q;; sont des blocs rectangulaires dans la matrice Q de dimensions 
nxXn, n X m, mx n, m X m respectivement). Compte tenu du 


fait que © ne dépend pas de £, nous tirons de (3) que Q est la solution 
du problème de Cauchy pour l'équation différentielle des blocs de 


matrices 
d Gys (yo 2. és (é) ’ + on 
a rs "a _ f. (é) 0 os Goo | 
Qui (T, T) Gao (T, T) __ (En 0 
Fa (T, T) 2 (T, “ E (o n | 


En trouvant successivement les solutions des quatre équations 
matricielles qui constituent (4), on obtient 


dQa (é, T/dt = Qu () Qui (6, D, Qu (tr, D = En, 
d’où l’on voit que Q,, (é, t) = Q (t, t) est la matrice fondamentale 
du système (3) de 4.2.3. Les équations 


da (t, T/dt = pa (#) Que (f, Ts Que (T, ©) = 0, 


sont satisfaites par Q,, (t, t) = 0 et il ne peut y avoir d’autres solu- 
tions d’après le théorème d’unicité. Par ailleurs 


du (4, vdi = fs (t) Qu = fx (4) Q (6, t), Qu (t, 1) = 0, 


d’où l’on tire 


(4) 


t 
Qu, = \fa (s)Q (s, T) ds. 
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En particulier, 


— Qi (1, T) = Do (T) = (Po (T); + + +, Pom (T)) 
est la solution du problème de Cauchy (18) de 4.2.3 (voir (14) dans 
2.9.4; on peut aussi s’en convaincre directement en prenant la dérivée 
par rapport à t et en se servant des propriétés de la matrice fonda- 
mentale décrites dans le même théorème de 2.5.4. Enfin 


dQ,, (£, T)/dt — hs (E) Qu (, T) = 0, Q, (7, T7) = Em 
d'où Q, (t, T)=£Æ£m Ainsi 


SG ne Q (£4, T) ): 
— Po (t) En 
Substituant ce résultat dans (2) et séparant tout ce qui se rap- 


porte à E(fi; to, Zn @, T, v) = EF (ty, Los Lo: a) nous obtenons 
OFIOt, = 8Ë10t = f (ti), 
OF l0to = 0E/0t9 — — Qoy (615 Lo) P (to) — Dao (Es Lo) F (bo) — 


= Po (to) P (£o) — f (to); 
0F 0x = 0Ë/0x6 = Qui (br to) = — Po (to); 
0/0 = OË/Oa, = (2; (a Tx) A (Ts Ur) + 


+ Goo (é,, Tz) Af (Tr, Ur) = — Do (T}) AY (Tz; Ur) + Af (te, Ug); 
ce qui coïncide avec (14) à (17) de 4.2.3. 


$ 4.3*. Problèmes de commande optimale 
linéaires relativement aux variables de phase 


Ce paragraphe est consacré à une classe spéciale de problèmes de 
commande optimale. Cette classe est suffisamment importante du 
point de vue des applications, mais ce n’est pas seulement pour cela 
qu'elle nous intéresse. Sur l’exemple des problèmes à structure liné- 
aire relativement aux variables de phase, on peut montrer le plus 
clairement une des idées les plus fondamentales de toute la théorie. 
I] s’agit de la « convexité cachée » qui est toujours présente dans les 
problèmes de commande optimale. En fin de compte, c’est justement 
elle qui donne la possibilité d'écrire la condition nécessaire sous 
forme de « principe du maximum », i.e. sous une forme typique pour 
les problèmes de programmation convexe. Et si dans le paragraphe 
précédent nous avions cherché à souligner la relation entre les pro- 
blèmes de commande optimale et la théorie générale des problèmes 
d’extrémum différentiables, ici, c’est leur relation avec l'analyse 
convexe qui passe au premier plan. 
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Remarquons également que les conditions nécessaires d’extrémum 
rejoignent presque entièrement les conditions suffisantes, ce qui 
est typique des problèmes de programmation convexe. Enfin, et ceci 
est également d'importance pour faire apparaître la convexité cachée, 
dans ce paragraphe nous allons considérer non seulement les com- 
mandes continues par morceaux mais aussi les commandes mesu- 
rables. 


4.3.1. Réduction du problème de commande optimale linéaire 
pour les variables de phase à un problème du type de Liapounov. 
Soient À = {t,, t,] un intervalle fermé fixe de la droite numérique 
a;: A Rw,i—=0,1,...,m,et A: A — £ (R7, R”) des fonctions 
vectorielle et matricielle intégrables; 1 un espace topologique, 
f:AXU—R, i—0,1,...,m, et F(-.,.): AXU— R7 des 
fonctions continues ; Vois Vui, à — 0, 1,..., m, des éléments de R7* 
et c;, i — 1, 2, ..., m, des nombres. 

Le problème d’extrémum 


JL @(-}8())= Tao (0 2 (6) + fe (eu (D) di + 


‘ + Voo (£o) + Y107 (t:) —+ inf, 
z= A(t)z+F(t,u(t), u(t) EU, (4) 
Ji) u()= | (az (+: (, u (0) dt+ 


+ Voit (Lo) + Vait (br) € Ci, 
dans lequel les expressions qui se rapportent à la trajectoire de phase 
x apparaissent linéairement, est appelé problème de commande optimale 
linéaire relativement aux variables de phase. On peut, bien entendu, 
considérer ce problème comme un cas particulier du problème 
général de commande optimale (voir $ 4.2). Toutefois ici nous allons 
quelque peu élargir la famille des processus admissibles. 

Désignons par 7/ l’ensemble des applications uw: À — U mesu- 
rables (dans le sens de la définition de 4.2.6) telles que les fonctions 
tr f,(t,u(th)ett-- Fi(t,u(t))sontintégrables. La paire(x (+), u(-)) 
est appelée processus admissible si x (-): À — R” est une fonction 
vectorielle absolument continue (voir 2.1.8), u(-) EX, on a 


z(t = A(bz( +F(E, u(t) 
presque partout et les inégalités J; (x (+), u (-)) & c; se vérifient. 


Un processus admissible (x (-), u (-)) est appelé optimal s'il existe 
un & >> 0 tel que pour tout processus admissible (x (-), u (-)) vérifiant 
la condition || x (+) — z (-) 


lcça, rt, <E on à l'inégalité 


Tat)}u()>(æ(), à ()) 
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Nous montrerons maintenant que la structure linéaire permet 
de transformer le problème (1) en une forme dans laquelle x (+) et 
u (-) sont dans un certain sens séparés (et, en particulier, il n’y a 
plus de relation différentielle). 

Soit Q (+, -) la matrice fondamentale (voir 2.5.4) des solutions du 
système linéaire homogène 

x = À (ft) x. (2) 
D'après la formule (13) de 2.5.4, 
t 
2 (= Q (8 to) & (to) + | RE, 7) Fr u (x) dr. (3) 
Lo 
Substituant (3), nous pouvons transformer les fonctionnelles du: 
era (1) : 
Ji); . ))= 


“ {a (+) [a (&, to) & (to) + fac, ï) F (x, u (x)) dr |} dt + 


0 


Li 


+ | fie, u (6) dé + Yoit (to) + 
Lo 
li 


+ Vii | © (is Lo) & (Lo) + je (£a, T) F(T, u (r)) dx | — 


to 
li li 


=\ {as (HA(E, D F(x, u(r) dr dt+ \ñ: (x, u (r)) dr + 


lo Lo Lo 


t 
2 {| a; (Et) Q (6, to) dt + Voi + Vas (ét o)} t (bo) + 
Lo 


l1 


+ Va | Or, t) F(t,u(T)) dt — 


lo 


| |as ()Q (té, t) dt F (x, u(xr)) + 


Lo  T 


+ fe (eu (D) + vu8 (9 F (mu (D)} dr + 


+4 ET t) Q ( Le Lo) dt + Yo; + Y1:Q (£a to)} & ( (lo) = 


li 


no |& (T,u(t))dT+fB;x (to), (4) 


Lo 
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ou 
Gt u)= pi(n) F (x, u)— fi (rw), (5) 
Bi = Yoi — Pi (to): (6) 
ti 
pt = —vuR (E, 7) — | a: (D Q (8 7) dé, (7) 


T 


10; 15325 M: 
Le problème ({) se met donc sous la forme 


To(æ(-) u(-)= — ÀGoté, u (9) dé + Box (bo) + inf, 
A 


Tite) u (= — (GE (0) dt+Bir(to) & ci. 


A 


(8) 


Un tel problème sera appelé problème du type de Liapounov ou simple- 
ment problème de Liapounov. 


4.3.2. Théorème de Liapounov. Le théorème de Liapounov joue 
le rôle clé pour établir la relation entre les problèmes de commande 
optimale et ceux de programmation convexe. Il sera énoncé ici dans 
le cas d’une fonction vectorielle p: R — R? et une mesure de 
Lebesgue m sur la droite R. Des améliorations (sans trop d’impor- 
tance) des démonstrations permettent de généraliser ce théorème 
au cas d’un espace arbitraire muni d’une o©-algèbre @ et d’une 
mesure vectorielle finie continue (non atomique) arbitraire pu: 
GS — KR”. Dans l'énoncé donné ci-dessous, @ est la o-algèbre des 
sous-ensembles de R mesurables selon Lebesgue, tandis que u (4) — 


— F0 dt. 


A 

Contrairement aux autres parties de ce livre, ici et dans le sous- 
paragraphe suivant, nous devons nous servir de certains faits d’ana- 
lyse fonctionnelle et de théorie de la mesure qui, malgré leur impor- 
tance fondamentale, ne font généralement pas partie des principaux 
cours universitaires en U.R.S.S. Commençons par les définitions. 
Les expressions « mesurabilité », « intégrabilité », « presque partout », 
etc., sont par la suite entendues dans le sens de Lebesgue (pour la 
mesurabilité il est commode de se servir de la définition donnée 
dans 4.2.6). Deux fonctions sont dites équivalentes si elles coïncident 
presque partout. 

Définition 1. Soit À un intervalle arbitraire de la droite 
numérique. Nous désignerons par L, (A) et L, (A) les espaces normés 
dont les éléments sont les classes d'équivalence des fonctions x: 
À — R possédant une norme finie donnée par les égalités suivantes : 
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dans l’espace L, (A): 
IzC)I= | 1e (dt; (1) 


À 
dans l’espace L, (A): 


Ix(H=sup vrailz()l= inf sup [x(1. (2) 
A N,m(N)=0 tEAXN 


Proposition 1. Les espaces L, (A) et Lx (À) sont des 
espaces de Banach, L, (À) étant séparable. L'espace L, (A) est isomé- 
triquement isomorphe à l’espace dual L, (A)*, de sorte que les boules 
fermées y sont +-faiblement compactes. 

Nous remplacerons la démonstration de ces assertions par les 
renvois suivants: la complétude et séparabilité de l’espace Z, (A): 
[KF], ch. VII, $ {1 (l'existence d’une base dénombrable pour la 
mesure de Lebesgue sur un intervalle infini découle immédiatement 
de son existence sur les segments finis, puisque chaque tel intervalle 
se représente sous forme de réunion d’un nombre dénombrable de 
segments) ; la compacité dans la topologie +-faible des boules fermées 
dans un espace dual d’un espace séparable : [KF], p. 197; l’isomor- 
phisme isométrique entre Z, (A)* et L, (A) (et donc le fait que ce 
dernier est complet): [5]. 

Définition 2. Soit XÀ un espace vectoriel et À € X. Alors 
le point x de l’ensemble À est appelé point extrême lorsque 


z=at +(—a)jx, 0<a<iÂ, x, TEAM = Te 


Exercice 1. Démontrer qu’au moins un des points z1, ..., x, est 
un point extrême de leur enveloppe convexe conv {x,, ..., xh}. 


Théorème de Krein-Milman. Tout sous-ensemble 
compact convexe d’un espace vectoriel topologique localement convexe X 
contient au moins un point extrême et coïncide avec l'enveloppe convexe 
fermée de ses points extrêmes. 

Pour la démonstration de ce théorème, voir [5]. 

Passons maintenant au théorème principal du présent sous-para- 
graphe. 

Théorème de Liapounov. Sip:A— R7, p(:) — 
— (p, (+), ..., pn (-)) est une fonction vectorielle intégrable, alors 
l’ensemble 


M={zeR"Iz= | p (dt, A€G} 
À 


est un compact convexe de R”. (Rappelons que & est la o-algèbre des 
ensembles mesurables selon Lebesgue.) 
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onstration. A) (Considérons l'application A: 
R” définie par l'égalité 


V 5 


= (roro a= (lv no... Por O). 

À À À 
Elle est linéaire et, en outre, elle est continue relativement à la 
topologie +-faible dans Z,, (A) (par définition, cette topologie est la 
plus a parmi celles pour lesquelles toutes les applications 


IQ pe ), p(-)>, p (:) € LA (A) sont continues). 
en e 


= {bp (+) € Le (A 10<VY(G)<1, +tEA} 
est une boule fermée dans Z, (A) (de rayon {/, et de centre au point 


Ÿ (+), bd (t) = !/,). Par conséquent, il est convexe et, en vertu de la 

proposition 1, il est compact dans la topologie +-faible. Aïnsi, son 

image linéaire et continue AW est également convexe et compacte. 
La fonction caractéristique 


4, tE€A, 
1O={6 té A 


d’un ensemble arbitraire À € © appartient évidemment à W, donc 
| p (9 di= (ya (0) p(9 dt = A (xa (-)) EAW, 
À À 


de sorte que M & AW. Il reste à démontrer que M = AW. 

B) Supposons que le point £ appartient à AW. Son image inverse 
W: = W N A”t (6) est l’intersection d’un ensemble W convexe et 
compact dans la topologie +-faible et d’un ensemble At (£) convexe 
(une variété affine) fermé dans la même topologie (puisque À est 
continue relativement à celle-ci). Par conséquent, W4 est convexe 
et compact ; en vertu du théorème de Krein-Milman W: possède un 
point extrême x (+) € W4. 

Si nous démontrons que x (-) est la fonction caractéristique d’un 
certain ensemble À appartenant à ©, alors 


E— for@a- POP 
A 


et le théorème sera nr 

C)Si0<Lz(t) Let x (-) n’est pas une fonction caractéristique, 
alors, pour un certain & > 0, l’ensemble B, = ft|e<x(t) < 
< 1—Ee} est de mesure positive. La fonction œ&-> m (x) = 
— m Î(t,, &«) N B.] est continue et varie de O0 — m (t,) à m (B.) — 
— M(t;) (m (B) est la mesure de Lebesgue de l’ensemble B). Choisis- 
sant arbitrairement NW, prenons æ@z, k — 1,..., N — 1 de manière à 


352 CALCUL DES VARIATIONS CLASSIQUE [CH. IV 


avoir m (az) — k/NB,. Ceci détermine une décomposition PB, — 
= B, (J... UB,\ de l’ensemble PB, en NV sous-ensembles disjoints 
deux par deux 


B; . (—, œil N Be, se PB} x (Or 1» ax] N Be, 7 
sobre (Gras ©) NP; 
de mesure positive. 
Posons maintenant 


. 1EB, 
[0 ep (3 


Pour N > n le système linéaire homogène 


|y (Ep? di= Dur |: (t) di =0 
A 


k By 
possède une solution non nulle G HS HN). La fonction (3) cor- 


respondante sera désignée par y(-). Lorsque 0<À1<emax{ y 1}4, 
on à 


< , l BP 
OT er 


et donc z(-)+HAY()EW. On a de plus 
A GC)HAO)=A (GCDHAAT()= ELA (5 (0 pt dE. 


À 
Par conséquent, x (+) + y (+) E W. et puisque À 0, on voit que 
x (+) n'est pas un point extrême. 


Ainsi x (-) est une fonction caractéristique et le théorème est 
démontré. Æ 


4.3.3. Principe de Lagrange pour les problèmes de Liapounov. 
Dans ce sous-paragraphe A est un intervalle fixe de la droite numé- 
rique (fini ou infini), U, un espace topologique. 

Lemme sur la mesurabilité composée. Si 
la fonction f: À X U —+ R est continue, tandis que u: A —+ Ù est 
mesurable (dans le sens de la définition de 4.2.6), alors la fonction 
ti ft, u(t)) est également mesurable. 

Démonstration. Supposons que les 4, & À sont choisis 
de manière à avoir m (AK U 4,) = 0 (m est la mesure de Lebesgue), 


ñn 
les contraintes u (+) |A, possédant des prolongements à des fonctions 


continues sur 4,. Alors les fonctions # + f (t, u (t)), t € A, peuvent 
être prolongées à des fonctions continues sur À,. 
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Supposons maintenant que les fonctions continues f;: AXUÜU—R 
sont données. Désignons par %/ l’ensemble de toutes les applications 
mesurables u: À — 1 pour lesquelles les composées t -+ f;, (t, u (#t)) 
sont non seulement mesurables mais intégrables sur A, de sorte 


que les fonctions u (+) — [ Ji (t, u(t)) dt sont définies sur %. 
A 


D'autre part, soient X un espace vectoriel, g;,: X — R des fonc- 
tions convexes pour à = 0, 1,..., m’ et affines à valeurs finies pour 
im +1, ..., m, À &CX, un ensemble convexe. 

Le problème d’extrémum 


FU(C)+8 (0 [fo (D) d+8(2)— inf, 
A 
Fi) +8 = 
= (rite ua | T 


A 


SO, i=1,..., m’, 
—=0, i=m'+1,..., m, 
zEA, u(-)EU 
sera appelé problème de Liapounov. En guise de cas particulier, le 
problème de Liapounov comprend le problème standard de program- 
mation convexe, que nous avons étudié dans 1.3.3 (il faut poser 
m' — met f; — 0), et nous verrons par la suite que le théorème de 
Liapounov permet d'étendre à la situation plus générale considérée 


ici les raisonnements qui ont permis de démontrer le théorème de 
Kuhn-Tucker. 


La fonction 


(1) 


L (u(-), x, À, h)= 2h: (Fi (u(-)) +8: (x) (2) 


est appelée fonction de Lagrange pour le problème (1). 

Théorème (principe de Lagrange pour le 
problème de Liapounov). Supposons que les fonctions 
fi: AXH—R sont continues, les g;,: À — KR sont convexes pour 
i — 0,1,..., m'et affines pour i — m'+1,..., m, À &X est 
convexe. 

1. Si la paire (a (-), 2) est une solution du problème (1), alors 
on peut trouver un vecteur = rs ÀÂm)ERTF et un nombre 


ko qui ne s'annulent pas simultanément et tels que 


a) min à À, 1; (,u)= > DE (é, u (t)) presque partout, (3) 
uEU 
min À Uugr(e => Àg: () (4) 
XEA i=0 


23—0237 
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(principe du minimum) ; 


b) À >0, i—=0,1,...,m' (5} 
(condition de concordance des signes) : 
c) FC) +e (00, j=4..., m (6) 


(condition de non-rigidité complémentaire). 
2. Si(û (+), 2 EL X À et il existe des à € RY et À, > 0 tels 


que les conditions (3) à (6) sont remplies, alors (à (-), x) est la solution 
du problème (1). 
Démonstration. A\Lemme sur la convexité 
de l’image. 
L'image 
im SF — { = (£o - . -, Em) 18 = Fiu()}, u(+)EU} 
de l'application u(-)- F (u() = Fo(u()), ..., Fm(u(-)) 


est un ensemble convexe de Rmri. 
Démonstration. Soit 


Er = (8%, 8%, ..., E) = (u ()), k = 1, 2. 

La fonction p (+) = (po (+), ..., Pm(-)): R— Rat définie par 
les égalités 

jiGu®())—f;(t,u®()), 1EA, 

pi (D =| 

0, té A, 
est intégrable, puisque u®) (.) € 4. D'après le théorème de Liapou- 
nov, l’ensemble 


M={ilE= pd, 4eG} 
A 


est convexe et, les points 0 (4 — jet £! — E?(4 — À) appartenant 
à cet ensemble, on peut trouver pour tout « € [0, 1] des A, € © 
(i.e. des ensembles mesurables selon Lebesgue) tels que 


œ (£i — E5) — 
= | pi (t) dt | [f: (, ut (8) — f, (&, u@ (6)] dt = 


A% ANA 
= | AGuvE)a+ | HGu® (D) dE, 
AQNA ANA 
d’où 
| AGun()a+ | ft ue ()a- 
A4NA ANA% 


—aËt+(A—a)#, i—0,1,...,m. (1) 
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Posons maintenant 
u(@) (4), 1EA.NA, 
Ua (£) a 
u(2) (4), EAN Au. 
Alors d’après (7) 
Fi (Ua ()) = aËi + (1 — a) Ei, 
de sorte que F (u, (-)) = aËl + (1 — a) E*. 
B) Existence des multiplicateurs de La- 
grange. Comme nous avons déjà remarqué, nos raisonnements 


iront parallèlement à la démonstration du théorème de Kuhn- 
Tucker de 1.3.3. 


Par hypothèse, la paire (à (+), x) est une solution du problème 
(1); sans perte de généralité on peut supposer que Æ, (& (+)) + 


+ g, (x) = 0 (dans le cas contraire on peut soustraire cette constante 
de F, + £g0). Démontrons que l’ensemble 


C = {a = (ag, - .., Am) | AU (+), x) EL X À, 
Polu(-)+g(D <an Fiu(-)+r (DE, 
i=1,..., m, Fu(-))+g: (x) =, i—m'+1,...,m)} (8) 


est convexe. En effet, supposons que a*— (a, ..., a*)EC, k— 
— 1, 2, 0<8<1, (ut (.), x) sont des éléments de % X À tels 
que 


Fou (-)) + 80 (20) <'aë, 


La 
F(u® (.)) + 8; (x) _ 


e LA 
a, i—1,..., m’, 


. ’ 
ai, i=m'+1,..., m. 


D'après le lemme sur la convexité de l’image, il existe une fonction 


up (*) EX telle que 
Fi (uo (C) = 0F: UN () + (—-6)F;(u® (-)), 
10 33 

En outre xo — 62 + (1 — 0) x) € À d’après la convexité de À et 

gi (te) = gi (020 + (1 — 0) 20) = 0g; (2x0) + (1 — 0) g; (x®) 
pour à = m' +1, ..., m, puisque ces fonctions sont affines. Par 
conséquent, 
Fi (ue (+)) + gi (te) — 

= OLF ; (UM ()) + gi GO + —E6)LF ; (u® ()) + 8: (x )] = 

= Oo + (1 — 0) où, im +1,..., m. 


23% 
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Ensuite, g, étant une fonction convexe, on a 
F o (eo (+)) + Lo (te) — 
=60F0 (UC) + —6)F 0 (UP ()) + go (820 + (1 — 0) 9) K 
<O(F ou (-)) + go xN)) + (À — 0) (F0 (UP (-)) + go (x) < 
<Z Oui + (1 — 6) œ?. 
On démontre d’une manière analogue que 
F y (ue (+)) + g5 (te) Oui + (1 — 6) a, j—1,..., m° 
Mais alors on voit de la définition de l’ensemble C que 8œ! + 
+ ( —680)a?EC, i.e. C est convexe. 
En posant (u (-), x) — (à (:), x) dans (8), on obtient l'inclusion 
sie sad) la 0, om =0, rat; "M: 
dt = 0, i=m +1,..., m}. (9) 
En particulier, C est non vide. En outre 0 & C, car autrement, en 
vertu de (8), on aurait | 


Foa()+gD<0, F;Gt)+aD<o0, 
Lt: 5m, 


Fi@()+am=0, i=m +1,...,m, 


pour une certaine paire (& (+), x) et, par conséquent, (à (-), 2) ne 
serait pas une solution du problème (1). 
Appliquons le théorème de séparabilité en dimension finie 


{voir 1.3.3); nous obtenons des nombres À, 0: 28 qui 
ne sont pas nuls simultanément, tels que pour tous les «€ Con a 


l'inégalité D a; > 0. 
Puisque Te 0, : .., 0, &; = 1, 0, ..., O0 EC, où 1<j<m 
et a; = 0 pour i = O, j, on a l'inégalité ho +- À; > 0. En passant à 
la limite lorsque € | 0, on obtient À; > 0. De même 
(8, 0,...,0)€EC = >0 


et donc (5) est démontré. 
Pour tout £ = 0, on a 


(e,0,...,0,a;—F;(u(-)}+g;(x), 0,...,0)€ 
EC+ het LF;(u(-) +8 RIZ 
>0=À,(1F;(&()+r (2120. (10) 
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Puisque ts). T) est une paire admissible, 


x a [(<O0, 1<j Lm’, 
FGOH OS En om 49 
A l’aide de (10) et des inégalités À; > 0,1<j<m', déjà démon- 


trées ceci nous donne (6) 
Ensuite, pour tous les & > 0, (u (+), x) EL X À, on a, en vertu 
de (8), 


(Fou (-)) + 
+ go(r) +e, F (x (-)) + 81 (), es Fm (U(:)) + 8m (&)) € 


ec= > À (Fu) + ei (x) +eko— 


=L(u(); ZT; À. ho) +ek>0= L(u(.), x, À À) >0. 


Mais d’après (6) et l'hypothèse concernant F,+2g, faite précé- 
demment, on a Pt); z, À À) = 0. Par conséquent, pour la 
fonction de Lagrange (2) on a le principe du minimum 

min £(u(-), x, À, ho) = £ (& (+), 7, à, dy (12) 
XA 
Mais si ko > 0, on a (12) et les conditions (5) et (6) sont vérifiées, 
alors pour toute paire admissible (u(-), x) 


À Folu (D + 60) & À Fe (CD +8 = 


ñx (12) 


=D (fi) +a()=£(u(), x à lo) > 


i=0 


" n 2 7 LP A ñn (6) 
Z £ (u (-), x, À, M0) = 2 M (Fi (u(-))+ 8: (x)) = 
= ho (Fo (-) +80 @) + Fo (+) +8) > 
> 0 (u (+) + 80), 
de sorte que (à (-), x) est une solution du problème (1). 


C) Réduction au problème élémentaire. 
On voit facilement que la relation (12) est équivalente à la conjonc- 
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EE 
tion des relations (4) et de la relation 


min : MF; (u (-)) — 


u(-)€7 


= min DE hf (eu, (0) dt= | DS Ras (E, ü (D) dt = 
A 


UCIEZ À ; 


=Y Fi(u(-)). (13) 


En effet, si l’on a (4) et (13), alors 


#6), 8 8 1) hi C)+D ue > 


m 


>Ù MF; (u (-))+ Z À lg: (= £(u(-), zx, À, À) 


pour tous les u(-)E% et xE À, i.e. on a (12). Si, par contre, 
m m 

par exemple D, Ag; (x) << D) Âge, (x) pour un certain z€ À, alors 
i=0 i=0 


£ @(-), 2 à, À) = 2 Mi (+ 


1—= 


+ 2 LPT2 (x) < 2 À ; (u CZ Âge; (x); 


de sorte que (12) ne peut avoir lieu. 

Pour passer maintenant de (4) et (13) au principe du minimum, 
i.e. à (3) et (4), il faut montrer que l’on peut « introduire le min 
sous le signe de l’intégrale » dans (13), en d’autres termes, montrer 
que la fonction à (+) est une solution du problème de commande 
optimale auxiliaire 


[D u()atint, u()e4, 4 


A i=0 


si et seulement si on a la relation (3). 

Une assertion analogue a été déjà démontrée dans 3.1.4. Toute- 
fois nous avions alors supposé que la fonction à (+) est continue par 
morceaux, tandis qu'ici elle est seulement mesurable, et il faudra 
faire appel à des raisonnements plus délicats. 

D) Problème élémentaire à commandes 
mesurables. 
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Lemme sur les conditions de minimum 
dans le problème élémentaire de commande 
optimale. Soient À un intervalle de R, Ü un espace topologique, 
J:AXUÜ—+R une fonction continue et U l’ensemble des applications 
mesurables u: A — Ù telles que les fonctions t-- f(t, u(t)) sont 
intégrables sur À. 

Pour que à (+) € soit une solution du problème 


Fu()= {| f( u() din u()E%, (15) 
A 
il est nécessaire et suffisant d’avoir l'égalité 
f(t, u(9))=minf(#, u) (16) 
uEeu 


presque partout sur À. 

Démonstration. Suffisance. D'après (16) on a 
ft, ut) >f(é, à (t)) presque partout pour chaque u (+) € , 
d'où l’on tire F (u(-) > (ü (+)). 

Nécessité. Soit à (-) une solution du problème (15). Puisque 
u (-) est mesurable, il existe (voir 4.2.6) des ensembles mesurables 
An «Atels que m (ANKU 4,) = 0 et à la, Se prolonge à une fonc- 

n 


tion continue sur À,. Nous dirons que le point t € À, est essentiel 
lorsque m ((t — ô, t + 6) MN A,) 0 pour tout 6 > 0 et nous 
montrerons que l'égalité (16) est vérifiée en tous les points essentiels. 

En effet, si pour un point essentiel t € À, et un v EU on avait 
l'inégalité f (x, v) < f (tv, à ()), alors, les fonctions à (+) |4, et 
tr f(t, v) étant continues, on aurait la même inégalité dans un 
certain Ô-voisinage du point t dans l’ensemble À4,, i.e. 


ft, v)<f(t, à(t)), VtE(r— 6, rt + 6) NA. 


La fonction 


TA t(r—5, T+6)N4,, 


V, tE(T—0, T+Ô)NÀ,, 
appartient évidemment à 7/ et 
FUC)-F @C)= | HE v)—f(, 2()1 dt <0, 


(tT —-Ô, t+6)fA, 
puisque ft, v) <f(t, à (t)) et m ((t — ô, rt + 6) N 4,) > 0. 

[1 reste à démontrer que l’ensemble des points non essentiels est 
de mesure nulle. Si t € À, est non essentiel, alors il existe par défi- 
nition un Ô, pour lequel m ((t — ô:, t + 6.) N A,) — 0. En rétré- 
cissant l'intervalle, trouvons des nombres rationnels (&., B.) tels 
que TE (@&,, B:) et m ((œ&., B.) N À,) = 0. L'ensemble de tous les 
intervalles à extrémités rationnelles est dénombrable et, par consé- 
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quent, l’ensemble de ceux d’entre eux qui sont de la forme («., f.) 
pour un certain point non essentiel t € À, est au plus dénombrable. 
Désignons ces intervalles par Z,, Z,, ... Alors 4, N UJ, contient 


k 
tous les points non essentiels de À, et m (4, N Ul:) < 
k 


R 


Puisqu'il y a au plus une famille dénombrable d’ensembles À,, 
la réunion des ensembles de points non essentiels de chacun d’entre 
eux est également de mesure nulle. D’après ce que nous avons dé- 
montré, la relation (16) peut être fausse seulement sur AK UAÀA, 

n 


et ceci dans les points non essentiels, i.e. elle est vraie presque 
partout. 

E) Conclusion de la démonstration. D'après 
C) et D), pour avoir la condition (12), il est nécessaire et suffisant 
d’avoir simultanément (3) et (4). En remplaçant dans le dernier 
alinéa de la partie B) de la démonstration (12) par (3), (4), nous obte- 
nons toutes les assertions du théorème. El 


4.3.4. Théorème de dualité. Les notations dans ce sous-paragraphe 
sont les mêmes que dans le précédent. Rappelons que la notion de 
dualité pour les problèmes de programmation convexe a été intro- 
duite dans 3.3.2. Elle se rapportait à la méthode des perturbations. 
i.e. à l'inclusion d’un problème d’extrémum séparé dans une famille 
entière de problèmes du même type. Ici, nous procéderons de la 
même manière en nous limitant pour simplifier aux seules fonction- 
nelles intégrales. En outre, nous supposerons (ce qui sera très néces- 
saire à la démonstration) que À est un intervalle fermé de la droite 
numérique, tandis que l’espace topologique Ü, dans lequel prennent 
leurs valeurs les diverses commandes w (+), est séparable, ï.e. con- 
tient un sous-ensemble {u,} dénombrable partout dense. Par exemple, 
en guise de Ü on peut prendre un sous-ensemble quelconque de 
R',C(A, R°), CT (A, R7), Z, (A), mais l’espace L, (A) (voir 4.3.2) 
n’est plus séparable. 


Exercice 1. Démontrer ces assertions. 


Ainsi, considérons le problème de Liapounov 


Fou (= ft, u (0) din 


A 
Fiu()= (ft u(D)d4<0, (eu, 


RS RER 
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En fixant jf; incluons-la dans la famille 

Fou(-)—inf, Fiu() + a <o0. (3(x)} 
De même que dans 3.3.2, la S-fonction de la famille 3(«) se définit. 
par l'égalité 
S (a) = 
=inf{Fou()|l#:u()+au<0, u()EU}, aeR?. (1) 


L’analogie qui existe entre les problèmes de Liapounov et les pro- 
blèmes de programmation convexe a toujours lieu ici, et, quoique 
les fonctions F ; ne sont pas convexes, on a le 
Lemme 1. La fonction a > S (x) est convexe. 
Démonstration. D’après le lemme de 4.3.3, l’ensemble 


imF = {= (6e ..., Em IG =Fi:tu(), u(C)E)} 
est convexe dans R”+1, Récrivons (1) sous la forme 
S (a) — inf {6 | +a<0, EEimF}; 


en posant g; (E) = g; (Ëo, . . ., Em) — &;, nous voyons que S (@) 
est la valeur du problème de programmation convexe suivant 


Lo (E)— inf, g(f +a<0, ÉEEimF. 


Ce dernier problème est un cas particulier du problème considéré 
dans 3.3.2 (les contraintes du type d’égalités sont absentes, et donc 
il faut omettre Ÿ, À, etc.), de sorte que la convexité de S est garantie 
par le corollaire 4 de 3.3.2. 

Théorème de dualité pour les problèmes 
de Liapouno v. Soient À un intervalle fermé de R, Ü un espace: 
topologique séparable, f;: AXU—R, i — 0, 1,..., m, des fonc- 
tions continues, À une famille d'applications mesurables u: À — Ù. 
telles que les fonctions t — f; (t, u (t)) sont intégrables sur A. 

Si la S-fonction de la famille 3 (x) est continue au point à = 0, 
alors pour tout a € int (dom S) nous avons 


S (a)=sup (ka + | D(#, 2) dt), (2) 
À>0 A 
où 
D (ot, u)+2 hf: (, u)). (3) 


Démonstration. A) D’après le lemme, la fonction 
a ++ .$ (œ) est convexe, tandis que sa continuité en un seul point 
implique (proposition 3 de 2.6.2) sa continuité et l'égalité S (œ) — 
— (conv S) (œ) pour tous les & € int (dom S). D’après le théorème 
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de Fenchel-Moreau (voir 2.6.3), on a conv S$ = S**, de sorte que 
pour les mêmes a 


S (a) = S** (a) Ne S —S* (A)}. (4) 


Calculons maintenant S* (À). Par définition, 
S* (À) = Sup (Aa —S (œ)) — 


= sup (ha —int ( |f,(e n f.(@, u(t))dt+ 


D — 


+a;<O0, u( eu)}= 
— sup sup ha — _ Jo(&, u (t)) dt} = 
u(-)E7 a<-| f,(, u (t)) dt A 
À 


+ oo, À GR, 


m 
— inf [HG 2()+ 3 fi, u(@) | à. 
2 i=1 
Substituons maintenant l'expression trouvée dans (4), nous 
voyons que l'égalité (2), et donc le théorème tout entier, seront 
démontrés si l’on vérifie l’égalité 


inf [[ht M4 Aie umla- {ot na 6 

UCEZ à i=1 A 
où ® (ét, À) est définie par l'égalité (3). 

B) Lemme 2. Soient À un intervalle fermé de KR, Ü un espace 
topologique séparable, f: À X Ü— KR une fonction continue et 
une famille d'applications mesurables u: À — VU telles que la fonction 
tr fl, u(t)) est intégrable sur A. 

Alors la fonction 


p(t)=inf{f (6, v)} (6) 
veu ‘ 
est mesurable sur À, l'intégrale | (t) dt (finie ou égale à — ©) existe et 
A 
l'on a 
| pdt= |inff(e, u)&= int Ve u(t))dt. (7) 
\ A UEZ u(-)EZ à 


Démonstration. Soit {v, |k > 1} un sous-ensemble 
dénombrable partout dense dans 1. La fonction f étant continue, 
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les fonctions 
Pn (+) = min f(E, V3) (8) 


DHL 


sont continues et pour 2 — œ on a 
PA()flim inf f(é, v,)=inff(é, vy) = 
no 1<RLN kR 
inf ff, v)=p(t). (9) 
veu 


En outre, il existe des fonctions u, (+) € telles que p, (t) = 
= f (t,u, (t)). En effet, pour n = 1 ceci est vrai, et lorsque @, _, (£) = 


= f(t, Un (t)), on a 
On (t) = nn (7 (é, v,)] = min [On -1 (é), f(é, Un) = 


1<LRLN 
= min [f (é, Un (£)), Ï (ë, Un)] = (£, Un (£)), 
où la fonction 
7. tr () Si Pn-1 (1) KT, UV); 
" Un Si Pan ()>f(t, Un); 
appartient à 2% (en vertu de la continuité des fonctions l'inégalité 
Pr-1 () > f(t, v,) est satisfaite sur un ensemble ouvert et donc 
un (-) est mesurable ; l’intégrabilité de la fonction t -- f (£, u, (t)) = 
— ®n (t) découle de la continuité de œ, (t)). 
Etant en vertu de (9) la limite point par point de fonctions con- 
tinues (et donc mesurables), la fonction (+) est mesurable ([KF], 
p. 277). Représentons-la sous forme de différence 


PE) = f(, v) — lp (t) — F(, v)l 
d’une fonction continue et d’une fonction non négative ; nous voyons 
que l’intégrale \e (&) dt existe : elle est finie ou égale à (—oo) (la 
A 
fonction f ({, v), continue sur le segment À, possède une intégrale 
finie, tandis que l'intégrale d’une fonction mesurable non négative 


op (£) — f (t, v) existe, mais peut être égale à +oo). 
Puisque f(t, u(t)) > œ@(t) pour toute u (:) E 4, l'inégalité 


inf À rte. u (#)) dt> | o (t) dt (40) 
uC)EZ à A 


est évidente. Si le premier membre est égal à —oco, l'égalité (7) 
est vérifiée. S'il est fini, on voit qu’en vertu des inégalités 
Jet &> | on (D at 
À À 

= {tu taz int | 7 ut) 


. u(-)€2/ A 
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la suite d’intégrales | x (£) dt est bornée. En appliquant le 


A 
théorème de B.Levi ([KF], p. 296) à la suite non décroissante 
— ®, (-), nous voyons que la fonction œ(-) est intégrable et 


Jomat=tim [os (9 &>int | o, (D 4 
Â n 00 A n À 
inf [fu (> int [rt u (D) dt. 
ne: u(-)E9 ne 


Avec (10), ceci nous donne (7). 
D'après le lemme 2, on a (5), donc, comme nous l’avons constaté, 
ceci démontre le théorème. 


Exercice 2. Enoncer et démontrer le théorème de dualité pour le 
problème de Liapounov sous forme générale (voir (1) de 4.3.3). 


4.8.5. Principe du maximum pour les problèmes de commande 
optimale linéaires relativement aux variables de phase. Revenons 
au problème posé dans 4.3.1 


Jote(-), u(-))= | Lao (0 2 + fo(t, u (OI dé + 
A 
+ Yo0€ Ko) + V10€ (t4) —+ inf, (1) 


= A(bz+F(tu(), u()eEU, (2) 
Ji u (= | lee (+ ft, u (OI dt + 
A 


+ Voit (lo) + Yait (ti) = Cis LL, 2 dns ss Ie (3) 


Théorème (principe du maximum pour les 
problèmes linéaires relativement aux va- 
riables de phase). Supposons que les fonctions a;: À — R7*, 
i —0,1,...,m, A: A £ (R°, R°) sont intégrables sur le segment 
Ab 4 1er: soient Ü un espace topologique; f;: AXU—R, 
= 0, À, , M F: A X U— R' des fonctions continues, À l’en- 


semble des applications mesurables u: À — U telles que les fonctions 
tr ft, ut) tt Fit, u(t)) sont intégrables. 


1. Si (x (: 1e u (: )) est un processus optimal pour Le problème 
(1)-(3), alors il existe un nombre 1 >0, un vecteur À — (lu 7 , À m) € 


ERT*# et une fonction absolument continue D: ARTE qui ne 
s’annulent pas simultanément, tels que l'on a: 
a) l'équation d’'Euler-Lagrange (l'équation duale) 


p(= —p (D A (+2 Me (0; (© 
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b) la condition de transversalité 


De Run 20,1: 65) 
c) le principe du maximum 
max G(£, v)—=G (ft, u (t)) presque partout ; (6) 
. veu 
GE D) =D OF (D ufr (sv): (7) 


d) la condition de concordance des signes 
AZ 0, RC PE LL (8) 
e) les conditions de non-rigidité complémentaire 
MU: (&(), u())—c]=0, i=1,...,m. (9) 


2. Si, pour un processus admissible (x (+), à (-)), il existe des 
0 > 0, À € R"% et une fonction absolument continue p (-): A RTE 


vérifiant les conditions (4) à (9), alors (x (+), à (-)) est un processus 
optimal pour le problème (1)-(3). 

Du point de vue formel, les conditions (4) à (9) sont ici les mêmes 
que les conditions correspondantes dans 4.2.2 (le lecteur effectuera 
sans difficulté les transformations nécessaires pour passer d’un 
groupe de conditions à l’autre), mais il faut rappeler que leur con- 
tenu est quelque peu différent. La commande à (+) est supposée 
ici seulement mesurable, par conséquent, les conditions nécessaires 
(4) à (9) ne découlent pas des résultats du $ 4.2. 

En outre, la deuxième partie du théorème nous donne des con- 
suifisantes d’optimalité, ce qui n'avait pas lieu dans le 
$ 4.2. 

Démonstration. A\Réduction au problème 
de Liapounov. Dans 4.3.1, nous avions déjà réduit le pro- 
blème (1)-(3) à un problème d'’extrémum du type de Liapounov 
(voir (8) de 4.3.1), qui diffère des problèmes de 4.3.3 par la présence 
éventuelle d’inégalités > dans les contraintes. Il n’y a toutefois rien 
de grave ici, puisque les derniers termes de (8) dans 4.3.1 sont liné- 
aires ; en changeant les signes là où il le faut, nous obtiendrons à 
nouveau des fonctions convexes. 

Renumérotons les indices de manière que les contraintes du type 
d’'égalités soient situées dans (3) à la fin et posons, comme dans le 
$ 3.2, e; — 1 pour i — 0 et pour tous les à tels que l’on a les signes 
< et —= dans (3), et &; — —1 pour tous les à tels que l’on a le signe 
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> dans (3). Posons ensuite g, (x (-)) = Box (to) et g; (x (-)) — 
= €; (Pix (to) — ©), i > 1. 

Maintenant le problème (8) de 4.3.1 acquiert la forme standard 
de Liapounov: 


Jo (-), #(-)= —80 | Go, u (4) dt +80 (6 (-)) int. 
A 
Di) uC)= —e | G(e u(#)dt+ 
A 
SO: Let sm 


+a@ DT i==m'+1AÂ,...,m, oo) 


où les G; sont déterminés par la formule (5) de 4.3.1. 
B) Nécessité. Si (x (-), & (-)) est un processus optimal, 


alors il existe, en vertu du théorème de 4.3.3, des nombres À, non 
négatifs (pour 0 < i L m') qui ne s’annulent pas simultanément et. 
vérifient 


—2 &huGi(t,u (@)=min(-Z eG( v) (11) 
i= v i=0( 
presque partout 
D he (= min D Aug (e(-) 2) 
et 
Mid: @(-Du(-)=0, 1<i<m. (13) 


On voit facilement qu'en posant À; = eh on satisfait à la condition 
(8), tandis que (13) implique (9). 
Posons ensuite 


m 


p(D=2 hp: (14) 


où les p; (+) sont déterminés par les formules (7) de 4.3.1 d’où l’on | 
tire compte tenu de (6) de 4.3.1 


Pi (tn) = —Miis Pi (Co) = Yoi — Bi. (19) 


En calculant la dérivée, ou en se servant de la formule (14) de 2.5.4, 


on vérifie directement que p (+) est la solution de l'équation (4) 
tandis que (5) est valable pour k = 1. 
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A partir de (7), (14) et de la relation (5) dans 4.8.1, on obtient 


GG, v)=p(r) Ft, v)—Z M »— 


m 


2Ù eat FE Dh (6 = 22 &hiG(E v), 


i=0 
et alors (11) se transforme dans (6). 
Enfin, en substituant dans (12) la définition de g;,on a 


(2 eaB;) x (19) = min (Z esib,) 


m 


m 
Cette égalité est possible seulement si > À,B,= 2) e;ÀB;—0, ceci 
i=0 i=0 


étant ((5), k—0) découle de (14) et (15). 
C) Suffisance. Supposons que pour un processus admissible 


(x(-), u (- -)) il existe des À >0, À, p (:) vérifiant les condi- 
tions (4) à (9). Supposons en outre que les e; sont les mêmes 


que précédemment, re — £; À; et p;,(-) étant toujours définis par 
les égalités (7) de 4.3.1, de sorte que l’on a (15). Les fonctions 
m 


p(-)=} Asp; (:) et p(:) vérifient l'équation (4) et, en vertu de 
îi—= 

(9) avec k — 1, coïncident lorsque t —t,. D’après le théorème d’uni- 

cité p(t)= p(t) et donc 


((7) « 2 
Gi, v)=p(t)F(E, v)— 2 hifi (t, v) = 


= 2 es; [pi (t) Ft, v)—ÿj;(6, v)] 2 eh;G; (£, v) (16) 


et 
me À AO. X 
A Ai: E à À; (Voi — Pi (to)) =. 
LCORER LL (5) « 
2 Mvor— D Pi; (to) = P (to) — P (to) = (0. (17) 


Les relations (16) et (6) impliquent (11), tandis que (9) implique 


(13), enfin (8), vu les égalités À; = É À, signifie que À _0i— 
= ., m. En outre, on déduit de (17) et de la définition des 


L] e e 
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£; (+) les égalités 
m m 


mn 
2 lg: (x (-)) = 2 h;e;p;x (Go) — 2: Ae;C; — 


m 


0 Ms) 2 (4) — 2 Me) Aucs, 


donc (12) a également lieu. D'après le” théorème de 4.3.3, les con- 


ditions (11) à (13) avec les inégalités de > 0,1, >0,i>1, sont 
suffisantes pour l’optimalité de (x (-), û (-)). 5 


$ 4.4. Application de la théorie générale au 
problème le plus simple du calcul des variations classique 


Nous appliquons ici la théorie générale au problème le plus 
simple du calcul des variations classique, auquel tant de place est 
consacré dans le manuel. On peut obtenir d’une manière analogue 
des conditions nécessaires et suffisantes d’extrémum faible et des 
conditions nécessaires d’extrémum fort dans le problème général de 
Lagrange. Mais ceci aurait pris trop de place sans introduire quoique 
ce soit de neuf en principe. Nous nous limiterons par conséquent à 
un cas particulier dans lequel on peut mener notre étude jusqu’à 
la fin et montrer la relation entre les théories ancienne et nouvelle. 


4.4.1. Equation d’Euler. Condition de Weierstrass. Condition de 
Legendre. Le problème (vectoriel) le plus simple du calcul des variations 
classique est (comparer à 1.2.6) le problème d’extrémum suivant: 


J (&(: DIT c(t), z(t))dtextr, (1) 


Z(lo) = Los T(t1) = T4. (2) 


Ici la fonction L: V —- R est au moins continue sur l’ensemble ouvert 
VER X R'X R"; zx,, x, to, t, sont fixes. 

Le problème (1), (2) est étudié en deux variantes. Dans la pre- 
mière x (+) appartient à l’espace CT ([£,, til, R°) et l’extrémum local 
dans ce cas est appelé faible a à 1.4.1). Dans la deuxième, 
x (+) appartient à l’espace XC1 ([6,, t,l, R”) des fonctions à dérivée 
continue par morceaux, muni de la norme [[x (+) [| — sup |æx(t) |, 


o St ti 


l’extrémum local dans ce cas est dit fort. 


Exercice 1. Vérifier que l'espace KCY ([to, tr], R') est normé, mais 
n’est pas un espace de Banach (i.e. n’est pas complet). 
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Dans les deux variantes x (+) est appelée admissible lorsque son 


graphique élargi {(t, x (t), x (t)) [to Lt Lt} est contenu dans V 
et vérifie les conditions aux limites (2). L'ensemble des fonctions 
admissibles x (+) sera désigné par 7°. Les notations introduites ici 
et par la suite, ainsi que la terminologie, seront conservées dans le 
paragraphe entier. Par souci de brièveté, nous appellerons le pro- 
blème (1), (2) problème le plus simple, laissant de côté les autres 
qualificatifs. 


Exercice 2. Démontrer que 


inf Y (a (-)) = inf TJ (x(:)). 
NC [tot], RŸ) YPNKCULto, ti], R°7) 
Indication. Servez-vous du lemme sur l'arrondissement des angles 
(voir 1.4.3). 
Si æ (-) donne un extrémum fort au problème (1) et la fonction 


x (-) est continue, alors, évidemment, x (+) donne également un 
extrémum faible. Par conséquent, les conditions nécessaires d’extré- 


mum faible le sont également (dans le cas où x (+) est continue) pour 
l’extrémum fort. Nous connaissons déjà certaines des conditions 
nécessaires. Dans le $ 1.4, par des méthodes élémentaires, nous 
avons établi: l'équation d’Euler, condition nécessaire 
d’extrémum faible, et (pour n — 1)la condition de Weier- 
strass,condition nécessaire de minimum fort. Voyons maintenant 
comment se présente le problème le plus simple du point de vue 
général. D'une part, (1), (2) se réduit au problème de Lagrange 
suivant : 
ta 
J&(), u())= | L(t, xt), u(é)) dt extr, (3) 


Lo 
LT — U, TL (Lo) == Lo; TL (é) — Li. 
Si l’on suppose que non seulement Z, mais aussi ses dérivées 


par rapport à x, u sont continues dans Ÿ, on peut appliquer à (3) 
le théorème d’Euler-Lagrange du $ 4.1. Alors, l’optimalité faible 


du processus (x (-), u (-)) dans le problème (3) signifie exactement la 
même chose que l’extrémalité faible de x (-) dans le problème (1), (2). 

Si x (-) donne un extrémum faible au problème (1), (2), alors, 
en vertu du théorème d’Euler-Lagrange, il existe un ko et une fonc- 
tion P (-) E CT (Lt, t,1, R?7*#) tels que 


P(#)= hole (8, & (+), & (9), p (9) = hole (6, 2(8), ZE). 


24—-0237 
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Si À — 0, tous les multiplicateurs de Lagrange s’annulent, par 


conséquent, on peut poser Ào — 1. En éliminant p (-), on obtient 
le système d’équations d’Euler 


27 Le (4) = Lx (9 (4) 


(comme toujours, on a ici L. ()= L. (1, x (#), x (t)), etc.). 
X 


D'autre part, on peut considérer le problème (3) (en supposant, 
pour fixer les idées, que c’est un problème de minimum; dans le 
problème de maximum ïil faut remplacer L par —L), comme un 
problème de commande optimale avec 1 — R?. 

Si l’on suppose que ZL et Z, sont continues relativement à l’en- 
semble de toutes les variables, on peut appliquer à (1), (2) le prin- 
cipe du maximum du $ 4.2. Dans ce cas l’optimalité du processus 


(x (:), u (-)) signifie que la fonction 
x (+) € KC! (Ito, til, R°) 


donne un minimum fort au problème (1), (2). 
Il découle du principe du maximum que l’on peut trouver un 


dr > 0 et une fonction différentiable par morceaux p (-): Lo, til —- 
— RT* tels que 


D = oËs (6, 5) 


min {AL(t, t(t), u)—p(t)}u} = 
uER”? 


= L(, z(), rE)—p@z(@. (6) 
L'égalité ho = 0 est ici impossible, puisque on tire de (9) Les rela- 
tions h=0=p(t)= Cte et p(t)Æ0 (autrement tous les multi- 


plicateurs de Lagrange seraient nuls). Mais lorsque À — 0 et p 0, 
la relation (6) ne peut avoir lieu (une fonction linéaire non triviale 


ne possède pas de minimum sur R”). Ainsi ko Æ 0 et l’on peut 
supposer que = 
La condition (6) se récrit sous forme subdifférentielle 


p (#) € (8.1) (t, x (ë), x (D). (7) 


Si L est différentiable relativement à x aussi, alors (6) implique 
l'égalité D (£) = Ê: (£) et nous obtenons d’une part l'équation 
d’'Euler (4), et d’autre part, nous tirons de (6) la condition nécessaire 
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Lt, x(t), u)—L(t, z(t), 2 (D)—L. (é, x), 5 (0) &— 50) > 0 
8 
VueR”, VtEft, dl. 5 


Introduisons (comparer à 1.4.4) la fonction de Weierstrass & 
(du latin excessus, excédent) 


ét, zx, E,u)=Li(t,zx,u) — Lt, x, £) — 
— Li (t, x, £) (u — Ë). (9) 


Alors la condition . Weierstrass (8) peut se mettre sous la forme 


6 (t, x (#), x (6), u)>0, VueR", VteElto, ti]. (10) 
Si l’on suppose que non seulement L et Le, mais aussi Le. 


sont continues dans V, on tire de (8) l'inégalité 
L.. (4) 2>0, t'Eto; tal. (11) 
La condition (11) est appelée condition de Legendre. 

Ainsi l’équation d’Euler est une condition nécessaire d’extrémum 
faible aussi bien que fort. En outre, nous avons déduit du principe 
du maximum encore deux conditions nécessaires de minimum fort : 
la condition de Weierstrass et celle de Legendre (dans le sous-para- 
graphe suivant nous verrons que cette dernière doit également être 
satisfaite pour le minimum faible). 


4.4.2. Conditions de deuxième ordre pour l’extrémum faible. 
Conditions de Legendre et Jacobi. 


Lemme. Supposons que la fonction L est continue dans V et 
en outre ses dérivées Lx; L' ’ Lax; L. . L' Ci existent et sont 
continues dans V. 0. ds 

Si z(-)EC! (To, tal, R7) vérifie l'équation d'Euler, on a la 
formule asymptotique suivante pour [| h(:)|le: — 0 : 

11 
J E()+h (= 3 @ (+ |A (O7 Êxe (0 À (D + 
lo 
2h (9 £ (0 k (DR (OT LC À (ON dt+ 
Ê1 , 
o([UA@P+ IR GEI dE), (0 
lo 
Vh(-)E Ci (Los til, KR”), h (to) = À (4) = 0. 


24% 
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Démonstration. Comme dans le sous-paragraphe 2.4.2, 


en entourant le graphique de x (+) par un compact entièrement con- 
tenu dans V, et en nous servant ensuite de la continuité uniforme 
des dérivées secondes de la fonction Z sur ce compact pour donner 
une estimation du terme résiduel dans la formule de Taylor, nous 
obtenons la décomposition 


Le, 2 (+ (0, & (0 +h (0) = 
=L(+L(920+E. (0 k (+ 
HART (2) És (8) Re (0) + 2HT (0) £ (D À (D + 


HAT (0 Le (Dh (D}+e (8 RCDUROP+IROPL  @ 


où € (£; h (-)) tend vers zéro uniformément sur A lorsque || À (+) |[o1—- 
— 0 


Prenant l'intégrale de cette relation de t, à t,, en intégrant comme 
d'habitude par parties le terme linéaire en h (t) et en appliquant 
ensuite l’équation d’'Euler, on obtient (1). M 

Si x (+) donne un minimum faible au problème (1), (2) de 4.4.1, 
alors en remplaçant À (+) par ah (+) dans (1) et en calculant la limite 
lim [7x () + ah(-)) — (x (-))la? pour &« | 0, nous voyons que 
la fonctionnelle quadratique Q vérifie 

1 
QU (-)}= | ET (0) Ês (0 Re (e)+2H7 (9 L (D h (D + 


10 
+hT()L..(Dh(}dt>0, (3) 
Vh()ECT(Léos ti], R7), k(to)—=h(t)=0. 


Cela signifie que la fonction h ( +) = 0 donne un minimum faible 
au problème d'extrémum secondaire 


QC) inf, ko) = h (4) = 0. (à) 


D'après le lemme sur l’arrondissement des angles (voir 1.4.3), les 
bornes inférieures de la fonctionnelle Q sur les ensembles de fonctions 
admissibles dans les espaces CT (ft, t,1, R7) et ÆCT (LE, 2,1, R7) 


coïncident. Par conséquent k (+) = 0 donne également un minimum 
fort au problème (4) (remarquons qu'en vertu de l’homogénéité 
de Q, les minimums locaux sont également des minimums globale- 
ment et la différence entre les minimums faibles et forts se réduit 
au changement de l’ensemble des fonctions admissibles). 
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D'après ce que nous avons démontré dans 4.4.1, nous devons 
avoir pour le problème (4) la condition de Legendre qui a évidem- 
ment la même forme 


L.. (20, Velo 4] (5) 


que pour (1), (2). Aïnsi la condition de Legendre s'avère nécessaire 
non seulement pour le minimum fort, comme dans 4.4.1, mais aussi 
pour le minimum faible. 

L'équation d’Euler pour le problème secondaire (4) 


He (OhO+L DRD=É.DRO+Éx (DRE (6 


est appelée équation de Jacobi pour le problème de départ (1), (2) 
de 4.4.1. 
Définition. Le point test appelé point conjugué au point 


* 


t, (relativement à la fonctionnelle Q) si l'équation de Jacobi (6) 
possède une solution k (+) pour laquelle h (t,) — h (rt) — 0, mais) 


L.. (DR (0 0. (7) 


Théorème { ((tonditions nécessaires d’ex- 
trémum faible pourle problème le plus 
simple). Supposons que la fonction L vérifie les hypothèses du lemme. 


Six(-) donne un minimum faible au problème (1), (2) de 4.4.1, 
alors 

1) x (+) vérifie l'équation d’'Euler (4) dans 4.4.1 ; 

2) on a la condition de Legendre (5) ; 

3) on a la condition de Jacobi: dans l'intervalle (t,, t,) il n'y 
a pas de points conjugués à to ; 

4) on a l'inégalité (3). 

Dans le cas où x (+) donne un maximum faible, il faut remplacer 
le signe > par < dans (3) et (5). 

Démonstration. Les assertions 1), 2) et 4) ont déjà 
été démontrées: voir (1) dans le sous-paragraphe précédent. Par 
conséquent, il ne reste qu’à démontrer 3). Supposons le contraire: 
Soit T € (to, t1) le point conjugué à t, et À (+) la solution correspon- 
dante de l'équation de Jacobi h(t,) — h (rt) — 0, (7) ayant lieu. 


1) En général, dans les manuels de calcul des variations on définit les points 
conjugués en posant la condition de Legendre sous forme plus forte: L;:(#) > 0. 


Sous cette hypothèse Li: (x) k (t) — 0: À (x) — 0 et, puisque À (rt) = 0, 
le théorème d’unicité implique h (+) = 0. La condition (7) est donc équiva- 
lente à la non-trivialité de h (+), on la remplace généralement par cette hypo- 
thèse. 
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Posons 

7 = h (t), to SLT; 

5 o={6 1<i<th. à 
Alors 


Q (3) = À (OT Lee (9 P (0) +28 OT É + (0 RO + 


to 


+R (DT Le (0 h (6)} dt = 


= LH (DT LÉ ne (0 RCD Ê (OR (O1 dt + 


A LION CLOS ACL 


to 
(nous nous sommes servis ici du fait que RTL OR) = 
X 


= h (t)T L. (t)h(t)). En nous rappelant que A(:) vérifie l'équa- 
tion (6),calculons par parties la première intégrale (les égalités 
h (to) =h(t) =0 étant prises en considération); nous voyons alors 
que les intégrales s’annulent. Ainsi Q(R(-))=0, ce qui signifie 


que h(:) donne (ainsi que la fonction h(:)=0) un minimum 
fort au problème (4). Appliquons à nouveau le principe du ma- 


ximum du $ 4.2. Nous en tirons l’existence d’un 9 >0 et d’une 
fonction p(-): [to, t1]—R'"# différentiable par morceaux, tels que 


p (9 = ob» (8) À (#) + Pole (#) À (E), 
min {AouTL.. (é) u+ oh (&)T Le (t) u—P (t) u} = 
uER? xx xx 
= ht (0 D. (DR (DH TE. (Dh (D—-POAE. 
On démontre par le même raisonnement que précédemment que À E 


£ 0 et l’on peut supposer que À) — 4/2. 
Il découle des relations (9) que 


p(=L.. (Dh (+: (02. (10) 
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Mais pour {> 7T la fonction h (:) est identiquement nulle, il 
découle donc de (10) que P (t + 0) — 0. D'autre part, 


D(r—0)= Le. (0) À (7 —0) = Ê. (1) À (0 #0 


en vertu de (7). Par conséquent, p est discontinue, mais en vertu du 
principe du maximum elle doit être continue. La contradiction obte- 
nue démontre la condition de Jacobi. 

Ainsi nous avons établi que toutes les conditions nécessaires 
d’extrémum dans le problème le plus simple envisagées d'habitude 
dans les cours de calcul des variations, à savoir celles d’Euler, de 
Legendre, de Jacobi et de Weïerstrass, sont des conséquences du prin- 
cipe du maximum. Passons maintenant aux conditions suffisantes 
d’extrémum faible. 

Théorème 2 (conditions suffisantes d’ex- 
trémum faible pour le problème le plus si m- 
ple). Supposons que la fonction L vérifie les conditions du lemme, 


la fonction x (-) appartient à C1 ([t,, t.l, R°) et son graphique élargi 
{#, x (#), x (t) [to LtLt:} est contenu dans V. 
Si : 


1) la fonction x (-) vérifie l'équation d'Euler ((4) dans 4.4.1); 


2) les conditions aux limites x (o) = Los x (£,) = x, sont vérifiées ; 
3) on a la condition de Legendre sous la forme forte 


L.. (2), 2()>0,  VtElto til: (11) 


4) on a la condition de Jacobi sous la forme forte: dans le semi- 


intervalle (to, t,l il n'y a pas de points conjugués à to, alors x (-) 
donne un minimum faible strict (un maximum, si l’on remplace 
le signe > par << dans (11)) au problème le plus simple (1), (2) 
de 4.4.1. 

La démonstration de ce théorème sera effectuée dans 4.4.5. 


4.4.3. Formalisme hamiltonien. Théorème sur l’invariant intégral. 
Nous avons déjà mentionné dans 4.1.1 que les équations d’Euler- 
Lagrange avec les équations de relation différentielle peuvent être 
amenées à un système hamiltonien (ou canonique) de la forme 


x = dE p (é, T, P), p = — x (£, T, P); (1) 


où la fonction 4£ est appelée hamiltonien (ou fonction de Hamilton) 
du problème donné. Ici, nous étudions cette transformation plus 
en détail, en restant dans le cadre du problème le plus simple (1), 
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(2) de 4.4.1. Le passage de l’équation d’Euler pour ce problème ((4) 
dans 4.4.1) au système canonique (1) s'effectue à l’aide de la trans- 
formation de Legendre. C’est d’elle que nous allons maintenant 
nous occuper. 

Définition 1. Supposons que la fonction L: v— R est 
de classe CT (v) dans l’ouvert v de l’espace normé X et sa dérivée 
applique biunivoquement v sur d = {p | p = l'(£), EÉEv} cX*; 
E: dv est l’application inverse à l/’. La fonction h: dk, 
définie par l'égalité 

h (p) = (p, £ (p)} — 1 (E (p)), (2) 


est appelée iransformée de Legendre classique de la fonction L. 

Proposition 1. Supposons que la fonction l: v—R est 
de classe C*? (v) dans l’ouvert convexe v de l’espace normé X. Si l” est 
définie positive, i.e. 


ŒI(E n) =/l"(E)in n1>0, VEEr, VnEex, n#Æ0, (3) 
alors la transformée de Legendre h (+) de la fonction L (+) est définie 


et coïncide dans d avec la transformée de Young-Fenchel (voir 2.6.3) 

de la fonction 

_ L'(E), V, 

EE RES @ 
+oo, Eév, 

qui est convexe. 


Démonstration. La convexité de ! a été démontrée 
dans 2.6.1 (exemple 2), la biunivocité de l'application & + [' (E) 
se démontre de manière analogue à la partie B) de la démonstration 
de la proposition 2 ci-dessous. 

Par définition de la fonction conjuguée (voir 2.6.3), on a 


ï @)=—sup {(p, E)—1(#}= — inf {t (E)—(p, E. 


Si pEd, alors p— l'E=T (£) pour un certain E Cv. Par con- 
séquent, O—(l’(£)—p)EO[I(-)—(p, -)1(£), d'où l'on tire que Ë 
est un point de minimum de la fonction {(-:)—(p, -) et 


Te (p)= — (LE —(p, E)=(p, E —1(®. 


Puisque p=l"(Ë), on a E—EËE (p) et par définition {*(p)—h(p). 
En nous rappelant l'inégalité de Young (voir 2.6.3) nous 
obtenons le 
Corollaire 1. Dans les hypothèses de la proposition 1 


l(É)+h(p)2> (p, Ë, VreEd  VEEv. (5) 
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Pour obtenir à partir du lagrangien L (£, x, 2) du problème le 
plus simple son hamiltonien SZ (t, x, p), il faut effectuer une trans- 


D! 


formation de Legendre relativement à la variable z. Ainsi 


| Se(t, a, p) = pr — Le, x, à), (6) 
où x doit être exclue à l’aide de la relation 
p = L.(t, x, à), (7) 


de sorte que la formule (6) définit &£ correctement lorsque l’applica- 
tion > L, (t, x, x) est biunivoque. (Dans les formules (6) et (7) 
x joue le rôle d’une variable indépendante ; pour ne pas la confondre 
avec dx/dt, nous la désignerons x = E par la suite, tout en gardant 
dans les notations pour les dérivées de ZL le symbole x, par exemple 


L., ôL/dx;, etc.). 

* Proposition 2. Supposons que la fonction (t, x, Ë) —- 
> L (t,x, Ë)est declasse CT (V),r> 2, dans l'’ouvert V &RXR"X R. 
1) Si: 

a) la dérivée seconde L.. dans V est non dégénérée, ï.e. 


XX 
det(——(,:,9)Æ0, V(, x, DEV: 
0x; 0x; 
b) l'application P définie par l'égalité 

Pt, zx, =, x, L.(, x, £)) 
est une bijection de V sur D ER X R° X R'*, alors D est ouvert, 
PE CT A (D) et la fonction SL: D —R, définie par les égalités 
(6) et (7), est de classe CT (D). 

2) Si pour tous (t, zx) la section V;,— £E | (t, x, 8) € V} 
est convexe et pour tous (t, x, Ë) € V la matrice de L::(t, x, E) est 
définie positive, alors les conditions a) et b) sont remplies et la conclu- 
sion de 1) reste valable. 

Démonstration. A) L'application inverse à P qui existe 
en vertu de b) est évidemment de la forme 


(£, T, P) Fe (£, Le (£, 7, P)); 


p=L.(z DæE=E(t, x, p) (8) 


Puisque L € CT (V), r > 2, l’application P appartient à C""1(V) & 
cCT(V). Sa matrice de Jacobi est de la forme 
1 0 O0 \ 


ù & 0 | 
La. De : La: 
xt xx 


XX 





de sorte que 


et son déterminant, égal à det Z.., est non nul en vertu de a). 
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Supposons que (és, Zos Po) — P (to, Los 60) est un point quel- 
conque de D. D'après le théorème des applications inverses, il existe 
un voisinage Ù 3 (t,, Zzo, E0o) dont l’image P (U) SD est un voisi- 
nage de (£,, Zo, Po). Par conséquent, D est ouvert. D’après le même 
théorème, P-1 (qui est bien définie) coïncide sur P (U) avec une 
application de classe C1. Puisque le point (£,, &o, Po) ED était 
arbitraire, on a P-1 € CT (D). En outre, il découle de (8) que & (#, x, 
p), en tant que fonction implicite, se détermine par l'équation 


FE: %, p: ë) = p — L. (, É ce) 0: 


Le 


cette dernière étant la composée de fonctions de classe C'"-!, on voit 
que E, ainsi que Pt, est de classe C'-T (D) (voir la remarque qui suit 
le théorème des fonctions implicites dans 2.3.4). 

Nous déduisons de (6), (7) et (8) l'identité 


(, x, p)=pE(t, x, p)—L(t x, E (6, x, p)). (9) 
En prenant sa dérivée, nous obtenons 
Dr pE—Li-—L.E=[p—L.(, x, JE-L- 
= Let SE (:-T; D)}, (10) 
Hu pEs—Le—Lils= — Loft, a, E(t,2,p)), (11) 
Ap=2+per—L.5,=<E(, x, p). (12) 


Les formules (10) à (12) montrent que les dérivées premières 
de la fonction 4£ sont des composées de fonctions de classe CT”1, 
par conséquent, elles appartiennent également à cette classe. Aïnsi 
G& € CT (D). 

B) Si la matrice de Z.. est définie positive, alors, d’après le 
critère de Sylvester (voir [9], p. 187), on a det L:: => 0, de sorte 
que a) est établie. Supposons que les sections V,, sont convexes. 
Alors, pour tout couple de points (£, x, &,)E V, k=1,2,0ona 
(, %, aë, + (1 — a) E2) € V, « € [0, 11. En désignant p4 = L. (4, 
x, 6x), on obtient 


Pi Pa=Le(t, x, É)—Lis(, x, b) = 
1 
” | 7 L: (té, x, a+ (1— a) E2) da — 
0 
1 
=] Les (t, æ, Gi +(1— 0) És) (Ë1 — 2) du. 


0 
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Si EE, mais P(, 2, E)=(t, x, p)=(t, x, p)=P(t, 2, E), 
alors p, = ps € 


O0 = (Pi — Pos 1 — É2) = > (Pai — Poi) (E1i — Eos) — 


i=1 


(t, x, GE, + (1— @) Eo) (Éii — Eos) (E15 — ei) da > 0, 


1 


ee 





Res ôx; 0x; 


puisque par hypothèse la fonction sous le signe de l'intégrale est 
positive (L:: est définie positive). Cette contradiction montre que 
Pi = Poe > Ey = Es, ie. b) est vérifiée. 

En se rappelant le corollaire 1, on obtient le 

Corollaire 2. Dans les hypothèses de la deuxième partie 
de la proposition 2 pour des (t, x, £) € V, (t, x, p) € D quelconques, 
on a l'inégalité 


de (t, x, p) + L(E, x, Ë) > (p, Ë). 


Passons maintenant aux relations entre l’équation d’Euler 
es ACT CE) (13) 
et le système de Hamilton (1). Nous appelons par la suite x: À + R? 
solution de l'équation (13) (ou la paire (x, p): À — R7 X R7*#, 
solution du système ({)), nous sous-entendons sans le dire explicite- 


ment que (é, æ(t), æ(t)) € V pour tous les t € À (respectivement 
(t, x(t), p(t)) ED). Plus brièvement, la solution x: A — R”" de 
l'équation d’Euler (13), ainsi que son graphique {(t,x ({) |{E€ sA 
sera appelée extrémale, et la solution (x, p)}: A—- R7 X R7* 
système de Hamilton (1) et son graphique {(t, x (t), pt) Ît€ A 
extrémale canonique (le contexte permettra toujours de distinguer 
s’il s’agit de fonctions ou de leurs graphiques). 

Proposition 3. Supposons que la fonction L € C?(V) vérifie 
les conditions a) et b) de la proposition 2. 

La paire (x (+), p (-)) est une extrémale canonique si et seulement 
si æ(-) est une extrémale et 


pt=L.(, xt), z(). (14) 
Démonstration. A) Supposons que zx (+) est une extré- 


male. Si p (-) est définie par l’égalité (14), on a d’après (8) x (t) — 
= E (4, x (t), p (t)). Maintenant la première des équations (1) 
découle de (12) et la deuxième de (11) et (13). 

B) Supposons que (x (:), p (-)) est une extrémale canonique. 
Alors la première des équations (1) implique (14) à l’aide de (12), 
(8), tandis que la deuxième des équations (1) se transforme en (15) 
en vertu de (11). 
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Remarque. L'hypothèse L € C?(V) est ici plus forte qu’il 
n’est réellement nécessaire: de même que dans 4.4.2, il aurait suffi 
de postuler l'existence et la continuité des dérivées premières et secon- 


des relativement à x; et x; seulement. Nous laissons au lecteur le 
soin d'établir la validité de cette remarque ; pour cela, il lui faudra 
introduire des modifications appropriées dans l’énoncé des théorèmes 
des fonctions implicites et des fonctions inverses (voir 2.3.4). 

Les systèmes hamiltoniens (1) possèdent de nombreuses propriétés 
remarquables (voir, par exemple, [21). Nous nous limiterons à une 
seule, qui se rapporte à la démonstration des conditions suffisantes 
d’extrémum. 

Théorème sur l’invariant intégral. Suppo- 
sons que la fonction $£ est de classe C? dans l’ouvert D &R X R' X 
X R"*, la forme différentielle w est définie dans D par l'égalité 


o=p dx—Sl di=», p;dzx;— 5 (t, x, p) dé, (15) 


11 


D, —= {x (@), xx (@), pr (æ) Ja <a <b}, k = 0, 1, sont deux 


courbes fermées dif férentiables par morceaux dans D (de sorte que t, (a)— 
tr (b), x (a) = xx (b), px (a) = pr (b)). 


Si l', s'obtient de l', par translation le long d’une extrémale cano- 
nique, i.e. si pour chaque « les points So (@) = (to (&), &o (&), Po (a) 
et Pi (@) = (t, (a), x1 (æ), p1 («)) sont situés sur une même extrémale 


canonique, alors 
ù n 
à @ = s) @. (16) 
To M 


Démonstration. A) En vertu du théorème classique 
sur la différentiabilité des solutions relativement aux données initia- 
les (voir 2.5.7) et le théorème de superposition (voir 2.2.2), la solu- 
tion du problème de Cauchy pour le système (1) à données initiales 
(£o (&), zo (&), po (&)), que nous désignerons par (x (f, a), p (t, «)), 
sera continûment différentiable par morceaux relativement à «& et 


D] 


continûment différentiable relativement à t. L'application 
oO: {(t, a)j|a<La<b, tElt (x), t, (a) — D 


(pour é, (æ) <t, (x) il faut écrire ici [t, (æ«), t, (æ)l) définie par 
l'égalité o (t, à) = (t, x (t, «), p (t, «)) détermine dans D une sur- 
face Z de dimension deux (fig. 38). Ayant choisi une orientation ap- 
propriée de Z, nous obtiendrons 9X = [', — [', (les deux arcs qui 
correspondent à œ&œ — a et « — b coïncident géométriquement mais 
possèdent des orientations opposées, de sorte que les intégrales le 
long de ces arcs s’annulent mutuellement). En vertu de la formule 
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de Stockes 


: b 11 (@) 
bobo \ o=—= | do — ( \ do [0:, 6,] dt da 
Fe. “0 5 a to (a) 


et l'égalité (16) sera démontrée si l’on vérifie que do [o,, 5,1 = 0. 
B) En prenant la dérivée de la forme (15), nous obtenons 


do= >, dp; /\ dx; [sat (x, dti + Sp, Avi) À dt = 
ii 


— ss) [dp; /Â\ dx; — Sex, dx; Â dt — Sn, dp; /\ dt]. (17) 


(Rappelons que pour la multiplication extérieur on a dt /\ dt — 0.) 





Fig. 33 


Lorsque Ë = (E;, Ex, Ep), 0 = (ns, x, Nr) Sont deux vecteurs 
tangents, nous obtenons de (17 




















n Ex Ex, Ës Ep, 6 
do [E, n] = =), 1 : — x, CAT | 
ee f, x, tÂm, Me Enr, |) 
1 Tr, Fos: 
ee — }) ét Ex, Ép, 
ur Nx; M», 
Par conséquent, 
n 1 Xp; — Dx, 
do [o:, ol = — 2; [1 x,,(6, à) p,,(t, a) | —0, 


= 
I 
> 


: O Zia(t, &) Pia(t; à) 
puisque O (t, &«) — (x(t, a), p (t, œ)) relativement à la variable t 
est une solution du système (1); par conséquent, les deux premières 
lignes du déterminant coïncident. 
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En vue de la relation (16), on appelle la forme différentielle (15) 
invariant intégral de Poincaré-Cartan. 

Définition 2. L'ensemble À &D est appelé ensemble de 
Legendre si 


&œ=—0 (18) 


Ÿ 
pour toute courbe fermée différentiable par morceaux y & À. Autre- 
ment dit, la contrainte @ | À est une forme fermée. 

(Il faut préciser ici la notion de différentiabilité par morceaux. 
Nous allons supposer que À est l’image d’un ouvert G & R* par 
l'application @: G—- D de classe C1(G) et que y est l’image par 
cette application d’une courbe fermée différentiable par morceaux 
dans le sens usuel ‘et y est contenue dans G.) 

Les trois exemples suivants d’ensembles de Legendre joueront 
un rôle essentiel par la suite. 

1) Choisissons un point (£,, Zo, Po) € D et considérons la famille 
d’extrémales canoniques {(x (£, À), pt, A)|[|aæa<t<f} à con- 
ditions initiales 

TAN =T, DNS À (19) 
L'ensemble 
= (6, 2, p)iz=zx(d,p=p(td,Ipo—Al<e, 
| a <t<f} 


est l’ensemble cherché ; & > Oet l'intervalle (x, B) 3 {, sont choisis 
de manière à avoir À CD. 

En effet, comme nous l’avons noté ci-dessus, la courbe fermée 
différentiable par morceaux y © À est l’image d’une courbe fermée 
ee par morceaux 
D'= {(£(9, A9) la<s<b, t(a) =t(b), À (a) = AG} 

Œ (&, $) X (Po — E&, Po + €) 
par l’application (£, À) — (t, x (ft, À), p (t, À)). Ayant projeté sur 
le plan t — t,, on obtient la courbe fermée 

lo = {Go AS) Ta Ls< DB, À (a) = À (b)} 
dont l’image vérifie 
Vo = {lo € (or À (s)), p (to, A (s) la LS b} — 
= {(o To A) la LS D} (20) 
en vertu de (19). Puisque Yo S’obtient de y par une translation le long 
des extrémales canoniques, on d’après le théorème sur l’invariant 
intégral, 


hi p dx — GR dt —0, 


L Vo Yo 
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car dx — 0, dt — 0 sur y, en vertu de (20). Puisque (18) est vérifié 
pour tout y &ÏZ, cet ensemble est un ensemble de Legendre. 
2) Soit x (-) une fonction numérique, une famille d’extrémales 
ze, A):(a, Br R, À E (a, Bi) vérifiant æ (+, +) E C1 ((a, B) X 
X (1, B1)) étant donnée. 
L'ensemble 


= A(T, T, p)lx=x(t, À); p=p(E, À) = 
_ Le (t, æ(é, À), x (à, À)), tE (a, P), AE (ou, Bi)} 


est l’ensemble cherché. En effet, soient y, y,, let l', les mêmes 
que précédemment. Alors 


b 
$o= $o=$pdr= | pe (9) 7 Go A (DA (6) ds. (21) 
V a 


Ayant désigné par (A) la primitive de la fonction À -- 
> D (lo, À) Ta (or À), nous pouvons continuer l'égalité (21): 


= (a (À (s)) À’ (s) ds = D (à (5) = = 0, 


puisque À (a — À (b) (la courbe est fermée). 

3) Proposition 4. Supposons que dans l’ouvert G CR X 
X R' on se donne une fonction p: G— nY D (Dh +45 pi): 
dont le graphique 2 = {(t, x, p (t, x)) | (£, x) € G} est contenu dans 
D. Pour que À soit un ensemble de Legendre : 

a) en supposant que p est continue, il faut et il suffit qu'il existe une 
fonction S € C! (G) telle que 


p c) = En (22) 
b) en supposant que p € C1 (G), il est nécessaire et, dans un domaine 


G simplement connexe, il est aussi suffisant qu'en chaque point (t, x) €G 
on ait les relations 








Op; __ OPr 
xp Or; ? (24) 
ÔpP; 0 0 OP _ 

Ôt x; ÔPk Ôx; ,k=1, AL 


Démonstration. En substituant p = p (t, x) dans (15), 
nous obtenons la forme 


© — pi, x) dr — ge (t, x, p(t, x)) dt. 
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L'ensemble Z étant de Legendre, il s'ensuit que bo — 0 pour 


tout l &G. Conformément au théorème classique d’analyse, ceci 


est équivalent au fait que © est une forme exacte, i.e. il existe une 
forme %$ telle que © — — dS. D'où l'on tire a). 

Lorsque p EC*(G),ona © EC1(G) et do = d (4S) = 0, ce qui est 
équivalent à (24). La suffisance de cette condition pour G simple- 
ment connexe découle du même théorème classique que a). Æ 

L'équation (23) est appelée équation de Hamilton-J'acobi. Si nous 
connaissons une de ses solutions dans le domaine G, alors (22) déter- 


mine une fonction à graphique de Legendre. 


4.4.4. Conditions suffisantes d’extrémum absolu dans le problème 
le plus simple. Envisageons à nouveau le problème le plus simple du 
calcul des variations classique 

1 
3 @(-)=| L(t, x, 2) dt extr, (1) 

to 
T (lo) = Los L(t1) = T1. (2) 
Nous supposerons que le lagrangien ZL est de classe C? dans l’ensemble 
ouvert VER X R7 X R7. Nous prendrons en guise de fonctions 
admissibles pour le problème (1), (2) les fonctions z(+) € KC! (It, #l, 
R") à dérivées continues par morceaux dont le graphique élargi 


{G, x (t),x (D It LtLt,} est contenu dans V. Pour fixer les 
idées, tous les raisonnements seront effectués pour le minimum, les 
modifications nécessaires dans les énoncés pour le cas du maximum 
seront facilement effectuées par le lecteur en remplaçant Z par —LZ. 

Dans 4.4.1 et 4.4.2 nous avons déjà vu que la condition de Legen- 


dre L. st) = L.. (#, x (#), x (t)) > 0 est nécessaire pour qu’une 
fonction admissible x (: ) donne un minimum au problème (1), (2). 
D'autre part, la condition de Legendre forte L:. (t) >> 0 fait partie 
des conditions suffisantes de minimum. Il en découle à son tour que 
les fonctions x —> L (£, x, 2) sont convexes près des points (#, x (&), 


x (&)) et ceci donne à penser que la convexité du lagrangien Z relati- 


vement à x dans tout le domaine de définition doit faire partie des 
conditions suffisantes de minimum absolu. Le théorème de Bogoliou- 
bov (1.4.3) confirme cette considération. Nous supposerons donc que 


et que pour tous les (£, x) la section 
— {£ |(4, x, É)E V} est convexe. (4) 
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I1 découle alors de la proposition 1 de 4.4.3 que la fonction 


fee L (+, T, Ë), (£, Ty £) EV, 
AE p={ (5) 
+ CO, (é, TL; Ë) ÊV 
est convexe relativement à E. 
Conformément à la proposition 2 de 4.4.3, les conditions (3) 


et (4) garantissent le fait que le hamiltonien S£ € C? (D) est bien 
défini par les relations 


Set, x, p)=pr—L(t, x, ©), 


(6) 
P = Le (, L;, x); 


desquelles il faut éliminer x. D'après le corollaire 2 du même sous- 
paragraphe, on a 
L'(t, x, Ë) + GE (t, x, p) > pé, a 
VG x DEV, V(, x, p) ED. 

Enfin, il nous faudra à nouveau nous servir de la forme différentielle 
de Poincaré-Cartan 

© = p dx — SE (t, x, p) di. (8) 

Théorèmeïi(conditionssuffisantes de mi- 

nimum). Supposons que L est de classe C? dans l’ouvert V &R X 

X R" X R?, les conditions (3) et (4) étant remplies. Supposons ensuite 

que D se définit comme dans la proposition 2 de 4.4.3, tandis que G 


est un ouvert de R X R7. 
Si: 


1) x (+): Léo, 411] — R' est une extrémale admissible du problème 
(1), (2) et son graphique 


= {HG 2() In <<) 
est contenu dans G; 
2) il existe une fonction p: G—- R"* de classe C1 (G) dont le gra- 
phique 
2 = {(, x, pi, x)) | (6, x) EG} 


est contenu dans D, tout en étant un ensemble de Legendre; 


3) POP 2()=L (6, 2(b), 2): 
alors 
{1 1 . R 
ÎLE 20, 2) \L(, 24, 26) at (9) 


25—0237 
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pour toute fonction admissible x (-+):[to, t:] — R” vérifiant les con- 
ditions aux limites (2) et ayant un graphique 
T'= {G, xt) lb <it<t} 
contenu dans G. 
Remarque. De la proposition 3 de 4.4.3, on tire l'égalité 


x (4) = Sp (à, x (é), p (t)); par conséquent, la dérivée z (t) est con- 
tinue en même temps que x(t) et p(t) = p (#t, x (t)). Ainsi, x (-) 
est continüment différentiable quoique nous avons considéré admis- 
sibles toutes les courbes différentiables par morceaux. Ce fait ne 
restreint pas l’applicabilité du théorème. En effet, nous avons montré 


dans 4.4.1 l’existence d’une fonction D (-) continue (et même dif- 
férentiable par morceaux) telle que p (t) = L. (#, x (t),  (t)) est la 
condition nécessaire d’un minimum (fort) qui découle du principe 
du maximum. Lorsqu'on a les conditions (3) et (4), cela signifie, 


comme nous l’avons vu, que x (:) doit être continue. 
Démonstration. Désignons p (t) = p (t, x (t)) et consi- 
dérons les courbes 


v= {6 20, PO) lb <t<h} CE, 
v= {E 2), PO) lb Lib} CZ. 


Puisque x (t;) — T (&;), i — 0, 1, et par conséquent p (t;) = 
= p(t;, x(t;)) = p (t;, z (é;)) = p (£;), les extrémités de ces courbes 
coïncident et l’on peut considérer la courbe fermée y — y 2 
que l’on obtient si l’on parcourt d’abord la courbe y de (4,, x (to); P (to)) 


à (£&, æ(t1), p (t1)) et ensuite on retourne suivant y. Puisque ZX 
est un ensemble de Legendre, 


0= Ÿ @= [o—{0. (40) 
v-?Ÿ Y Ÿ 
En se servant de l'inégalité (7), on obtient 
t1 


fo= (par 5 dt | {20-681 20, PO}a< 
YŸ Ÿ bo 


<|L(t,2(E), 2) d=S (@(), (411) 
Lo 
l'égalité étant ici possible seulement lorsque 


pr) dt xt, pO) =L(e, z(t, & (t), 
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1.e. (en se servant à nouveau de (7)) dans le cas où 


pOz(—d(t, xt), p(O)= max  {pr(t)— SE (t, x(8), p}}. 
{pl(t, x (t), p)E D} 
D'après le oreoe de Fermat, 


2 (#) = Sp (Et, x (8), p (t)). (12) 
Puisque p a un graphique de Legendre, nous devons 
avoir les égalités (24) de 4.4.3, d’où, compte tenu de (12), 


: d 
PO EE pi (t, z(5)— 











dt 
= OP; LE. . 0 OP 
+ 2 Gen ET En (+ 2 pr ÔPR Ô: }+ 
ô 0€ 
LORIE Sp (4 2(0, PE). (13) 


k 
D'après (12) et (13), (æ (- hs P (-)) est une extrémale canonique. 


Mais (x (0), P (to)) = (x (to), P (éo)) et, puisque (x (+), p (-)) est 

également une extrémale canonique (proposition 3 de 4.4.3), on 

tire du théorème d’unicité les relations x (ft) = x (4), pÜ = p (t). 
Ainsi il découle de (11) que 


t1 
(o=[z(, 2, 2 (D) = 3 GO), 
pe lo 


Ÿ 
et, pour les autres x (-) admissibles dont les graphiques sont contenus 
dans G et qui vérifient les conditions (2), on a 


fo<s(&(-). 
V 


En vertu de (10) on obtient 4 (x(-) > 3 (x(-)). M 
Corollaire. Dans les hypothèses du théorème, si G coïncide 


avec la projection de D sur R X R" = {(t, x)}, alors x (+) donne un 
minimum strict absolu au problème (1), 

Une partie des hypothèses du théorème que nous venons de démon- 
trer sont généralement présentées dans les cours de calcul des varia- 
tions sous une forme quelque peu différente, en relation avec la no- 
tion de champ d’extrémales. 

Définition. Supposons que À et G sont des ouverts dans 
R° et R X R” respectivement. La famille de fonctions 


{x (+, A): lo (À), 4 (I R°IAE A} 
forme un champ d'extrémales recouvrant G si: 


1) x (+, À) est une extrémale (solution de l’équation d’Euler} 
du problème (1), (2) pour tout À € A; 


25% 
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2) l'application (£, À) + (t, x (f, À)) est bijective et son image 
D lr=e(s M, HU <i<h A), À EA) 


contient G. 
3) la fonction p: G— R'* définie par les égalités 


pz=L.(, zh, z(e, à), 


(14) 
(, x) = (t, xt, À)), 
est de classe C1 (G) et possède un graphique de Legendre. 
La fonction u: G— R" définie par les égalités 
ut a) =x(t Ah), (ta) =(t, x(t, À), (15) 


est appelée fonction d’inclinaison du champ. L'extrémale x (-): 
Léo, t1]— R' fait partie du champ x (+, -) si son graphique est con- 


tenu dans G et x(t)=zx(t, À) pour un certain À € A. 

En substituant (14) et (15) dans (8) et en nous rappelant la défi- 
nition d’un ensemble de Legendre (voir 4.4.3), nous pouvons refor- 
muler la condition 3) de la manière suivante: 

3’) Dans le domaine G l'intégrale 


(1, %1) 
{Le (£, x, u(t, x)) dx — 
(to, X0) 


—[L, (ét, x, u(, z))u(t, x) —L (&, x, u(t, x))]} dt (16) 


ne dépend pas de la courbe entre les points (é,, x) et (f,, x) le 
long de laquelle on la calcule (en vertu d’un théorème classique d’ana- 
lyse, cette dernière condition est équivalente à l'hypothèse que 
toute intégrale le long d’une courbe fermée s’annule). L'intégrale 
(16) est appelée intégrale invariante de Hilbert. 

Théorème 1’. Supposons que la fonction L satisfait aux hypo- 


thèses du théorème 1 et soit x (+): [to, t1]—> R" une extrémale admis- 
sible dont le graphique est contenu dans G. 


Si x (+) peut être inclue dans un champ d'’extrémales recouvrant G, 


alors x (+) donne un minimum à la fonctionnelle (1) dans la classe 
des fonctions admissibles vérifiant les conditions (2) et telles que leurs 
graphiques sont contenus dans G. 

Les lecteurs vérifieront sans difficulté que ceci n’est qu'une refor- 
mulation du théorème 1. Elle est particulièrement commode lorsque 
n — À, car dans ce cas la condition 3) de la définition donnée ci-des- 
sus découle de 1) et 2) (voir le deuxième exemple d’ensembles de 
Legendre dans 4.4.3). Cette remarque peut être utile dans la solu- 
tion de nombreux problèmes. 


8 4.4] PROBLÈME DU CALCUL DES VARIATIONS CLASSIQUE 389 


4.4.5. Points conjugués. Conditions suffisantes d’extrémum fort 
et faible. Dans ce sous-paragraphe, nous supposons toujours que 


LE C?(V); T (-) EC! (lo, t1l, R7) est une extrémale admissible 
du problème (1), (2) de 4.4.4, le long de laquelle on a la condition 
de Legendre forte 


L. (4, 2(0, 2(0)>0, VHElte til. (1) 


D'après la continuité, la matrice de L.. reste définie positive 


dans un certain voisinage Ÿÿ du graphique élargi {(#, x (é), x (t))lto 
<t<th}. Choisissons le voisinage V de manière que ses sec- 


tions V, = {E(#, x, Ë) eV} soient Convexes. Alors on a les hypo- 
thèses de la proposition 2 de 4.4.3 conformément à laquelle nous 


pouvons déterminer un domaine DERXR"XR"#* et un hamil- 
tonien S: D +R de classe C2. 
Les deuxièmes membres du système canonique 


z = Hplti tp), p=—Sxlt, &, p) (2) 


sont continâment différentiables dans D. L'extrémale canonique 


(x (:), p (-)) qui correspond à l’extrémale x () et, par conséquent, 
celle-ci elle-même, peuvent être prolongées à un certain intervalle 
ouvert qui contient le segment [é,, t.]. En prenant ensuite, s’il le 


faut, le voisinage Ÿ plus petit, nous pouvons supposer que Ÿ est 
de la forme 


Pt, x, Dllr—z(l <e, [E—z(|<e, b—e<i<h+e}. 
Soit 
(fo: Tor Po) = (tos & (to); Le (for & (to); & (É0))). 

Construisons la famille d’extrémales canoniques  {(x (+, À), 
p (*, A))JIA — po |  Ô} définies par les conditions initiales 

Z (los À) = Zos D (or À) = À (3) 
(comparer au premier-exemple d'ensemble de Legendre dans 4.4.3). 
Pour un 6 suffisamment petit, les extrémales de cette famille ainsi 


que (x (+), p (+) = (&(-, po), P (+, po) sont contenues dans À pour 
tE (to, t11: les fonctions x (+, +), p (+, -) sont évidemment conti- 
nûment différentiables (voir 2.5.7). 


390 GALCUL DES VARIATIONS CLASSIQUE [CH IV 


Proposition 1{. Pour que le point —% € (to, t1l soit conjugué 
à Lo, il est nécessaire et suffisant d’avoir 


det ES = — (. (4) 


Démonstration. A) D'après le théorème de 2.5.7, l’en- 
semble des dérivées des solutions du système (2) relativement aux 
données initiales constitue, pour À = p,, la matrice fondamentale 
des solutions du système d'équations en variations correspondant 


— D pu + EE pp 
n — — TE — Rem. 


Les dérivées 0x/04;, dp/0}; qui nous intéressent, disposées en colon- 
nes, constituent la moitié (n de 2n) des colonnes de cette matrice et, 
en vertu des conditions (3), on a 


Ox/6à, 0 
fes | 7. (. ]: (6) 


L'égalité (4) est équivalente à l’existence d’un vecteur non nul c € R° 
vérifiant 


(5) 





Ô Ô 
7 (@ P)c= Don (mr pa=0. 


Désignons 


n 


et : 
É o)- ssh 
n () / Op 


Etant une combinaison linéaire des colonnes de la matrice fondamen- 
tale, ceci nous donne également une solution du système (5) et, 
d'après (6), on a E(t,) = 0, n (4) =c-Æ0. En outre, & (x) = 0. 
Ainsi l'égalité (4) est équivalente à l'existence d’une solution 
non triviale du système (5) vérifiant & (£,) — £ (x) = 0. 
B) L'emme. La paire {E (+), n (-)} est une solution du système 
(9) si et seulement si E (+) est une solution de l'équation de Jacobi 


+ [LE 1e L. E + L£ .Ë + Lt] (7) 
el 


n@= LE (+ Ê. E (D. (8) 
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Démonstration. Par définition (voir 4.4.2), l'équation 
(7) est l'équation d’Euler pour le problème d’extrémum secondaire 
à lagrangien 


À A pe e . _ A . 
9 (ETL se + 2ETL .E à a E°L..E}. (9) 
L’hamiltonien correspondant % s'obtient par transformation de 
Legendre relativement à & 
Ca mi n’E "ue, "2 
1 Le = D: ES L. &. 
Pour obtenir la deuxième de ces égalités, notons que 


Er 2 mb pi, 


(10) 





d’où 








9 em? € L &L à 

Ts (E°L .#) — ÿ ‘ by = D . 6j = (Le E)s. 
OE; # j ox À j ô j d 

D'une manière analogue 


2 CL: = (2 mL EE) 


= = ÿ — 9? L, Ë +D T Éy—(2LE)s. 











Ayant exclu ë de (10), on obtient 
67 {nt£sin—2ent Ésin+er (D ÊTE. —LuIE). (11) 
En se servant maintenant des formules (11), (12) et (8) de 4.4.3, on a 
Hx(t, x, p)=—L,;(t,x, © (£, x, p)), 
SE p (£, à, P) = (é, Ty P)s 
p= L. (é, x, E(E, x, p)). 


Prenant la dérivée relativement à x et p, on tire 


LS a Las &  … An #n 
PE xp = L'-Ep= LS pp 
”_ ôp _ PS = LL #n #n 
Fe om 
_ op … # LS à _ mn a LS 
D . 
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Pr = Li, Bap= —L 1, 
. | 4 : D (12) 
pe —Lilis Dar —ListL Lil. 


Par conséquent, (11) peut se récrire sous la forme 
1 # #R An 
= > {nl pp + 2 en + ET asE). 


D'après la proposition 3 de 4.4.3, la paire {E (+), n (-)} est une 
solution du système canonique 


= On, n= — (13) 


si et seulement si & (-) est une solution de (7) et l’on a la deuxième 
des relations (10), qui coïncide avec (8). Il ne reste qu’à remarquer que 
le système (13) est identique à (5). M 

C) Conclusion de la démonstration. Dans la 
première partie de la démonstration, nous avons montré que (4) 
est équivalente à l'existence d’une solution non triviale {£ (+), n (-)} 


B, = (£C),PC)) 





Fig. 39 


du système (5) vérifiant E (to) — € (t) — 0. D’après le lemme, 
E (-) est une solution de l'équation de Jacobi et l’on a (8), d’où 
n (rt) =Z.. (M) E (x). L'égalité n (rt) — 0 est en contradiction 
(d’après le théorème d’unicité) avec le fait que la solution est non 
triviale, donc n (rt) =£ 0. En nous rappelant la définition donnée 
dans 4.4.2, nous voyons que (4) est équivalente au fait que les points t 
et {, sont conjugués. 

L’assertion démontrée permet de donner l'interprétation géomé- 
trique suivante de la notion de point conjugué. Supposons à nouveau 
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que (x ( ), P (-)) est l’extrémale canonique correspondant à l’extré- 


male x (:) considérée. Pour un 6 suffisamment petit, les extrémales 
canoniques définies par les conditions (3) forment une bande le long 
du graphique B,B, (fig. 39). Pour t — t, le bord de cette bande est 


« vertical » et se projette sur le point À, = (to, to). La condition 
# e 9 « 97 e Lé ox Q sne 
(4), équivalente, comme nous l’avons vu, à l'égalité no 0, signifie 


que pour £ — 7t la bande au point B, = (xt, x (x), p (t)) est tangente 
à une certaine direction « verticale » (i.e. à une direction parallèle 
aux plans { = Cte et x = Cte). 

Si nous projetons la bande dans l’espace (£, x), nous obtenons 
une famille d’extrémales issues du point À, (fig. 39). Auprès du 


point À, = (r, x (t)) l'application (4, À) — (é, x (t, À)) cesse d’être 
bijective («les extrémales infiniment proches de x (-) et ayant la 


même origine se coupent au point À, »). Le point À, est également 
appelé point conjugué à À. 


Exercice. Sur la sphère S?— {(x, y, 2) | x? + y? + 2 — R?} les 
arcs des grands cercles sont les extrémales de la fonctionnelle de longueur. 
Ayant choisi un grand cercle passant par le point A, € S?, trouver un point 
sur ce cercle conjugué à 40. 


Proposition 2. Sil'on a la condition de Legendre forte (1) 
et la condition de J'acobi forte (le semi-intervalle (to, t,] ne contient 
pas de points conjugués à t,) sur l’extrémale x(-): Léo, t11— R°, alors 
cette extrémale peut être inclue dans un champ d’extrémales qui recouvre 
un certain voisinage G de son graphique {(t, x (t)) | to St ta}. 

Démonstration. A) Démontrons d’abord que pour un 
Ô >> 0 suffisamment petit, aucun des points de l'intervalle fermé 
[to, 4] ne sera conjugué à aucun point #5 € (t, — 6, t,). Dans le 
cas contraire, il existe des 14° — t,, 19" € [to, t.1 et des solutions 
EC (-) de l'équation de Jacobi (7) tels que 

EC) (460) = ED (4m) = 0, 


L; (4) EC (4) 0, 
L'équation étant homogène, on peut poser JE) ({m))|=1. En 


passant s’il le faut à une sous-suite, nous pouvons supposer que 
ee l € [o ti] 


ÉGD (HM) mn, Int = 1. 


Lorsqu'on à la condition (1), l’équation de Jacobi se réduit au 
système linéaire (5) dont les coefficients sont continus sur l'intervalle 
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fermé À = [é,, t,l et le problème de Cauchy à données initiales 
E(#) = 0, 
n()= Êe. (H)E(E)+Ê. (H)E(E)= Le. (E)n 


possède la solution (£& (t), n (é)) définie sur A (voir 2.5.4). D'après 
le théorème sur la dépendance continue de la solution relativement 
aux données initiales (voir 2.5.5), on a EC (4) + E (é) et 


ne (4) = Las (8) EC (6) + L. (EE (9) + n (6) 


uniformément sur À. Mais on a alors aussi ECn) (D —E( unifor- 
mément sur À. 
Ensuite, nous avons Ë (to) — lim 6 (669) = lim E(n) (49) —0. Alors 


les points to — lim En) et 1, — Him gqn) ne peuvent coïncider, puisque 


dans le cas me n = (1) 20, car 
4m) 


mms | 1Ét ()—É (I di|< 


0 


IE (E)] = 





LILÉC—E [le + max [E () —E (#)1— 0. 


[os #1] 


Puisque E (to) —&(t;) =0 et L.. (#4!) Ë (2!) -£ 0, le point t, E(to, ta] est 
conjugué à £o, Contrairement à l'hypothèse. 

B) Choisissons t, 1, de manière qu'il n’y ait pas de point 
conjugué à #5 sur [t, t,]. Construisons la famille d'extrémales cano- 
niques (x (-, À), p(-, À))en on dans (3) t, par to. D’après 


la proposition 4, on a det r ( Po) Æ0, VrE ts, t.l. 


Définissons l'application d C3——R X R”° du cylindre C; = 
= [t, — 6, t, + Ô] X B (ps, 6) par l'égalité p (£, À) = (#, x (ë, À)). 
Aux points (t, po), TE [to, t,l, son jacobien vérifie 


dot q'= det (| . }=det Z 0, 


Lt LA 


et nous pouvons choisir Ô de manière à conserver cette inégalité 
dans tous les points de C3. En outre, d'après le théorème sur les 
applications inverses (voir 2.3.4), il existe pour chaque point (t, Po) 
un voisinage U., appliqué bijectivement par @ sur W; — 
et 1€ C1 (WF). 

Montrons que pour 6 suffisamment petit l’application est Hs 
tive sur C; tout entier. Si c'était faux, il existerait deux suites (f,, Àa), 
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{ns An) telles que 
An Por Àn + Por (Ëns T (tn; Mn)) = P (Ëns Àn) = 

= 9 (ns An) = (is & (Es A). 
D'où l’on tire #,—=t,. 

En passant éventuellement à des sous-suites, nous pouvons 
supposer que in—tn->Tt. Pour des valeurs de n suffisamment 
orandes, les points (tn, An) et (fx, À») sont contenus dans U, et 
l'égalité (fn, Àn) — P(Ën; An) contredit la définition de U.. 

Montrons maintenant que G—œ(intC;) est un voisinage du 
graphique T'={(t, z(t))lé Kit}. Puisque = œ({{(t, po)lto Lt 
<t1}) CG, nous devons démontrer que G est ouvert. Mais si 
(t, 2)=@p{(t, A)EG, (t, A)ECs, on a det q’(f, À) 0 et, d'après 
le même théorème . 2.3.4, un voisinage du point (t, À) est ap- 
pliqué sur le voisinage du point (#, x). Par conséquent, (f, x) est 
un point intérieur de G et G est ouvert. 

Ainsi, la famille d’extrémales {x (+, À)} recouvre bijectivement G. 
Le fait que cette famille constitue un champ a été démontré lors de 
l'étude du premier exemple d’un ensemble de Legendre dans 4.4.3. 

Le champ construit consiste d’extrémales passant par un même 
point (fo, to); on l’appelle champ central. 

Revenons maintenant aux conditions suffisantes de minimum. 
Montrons tout d’abord comment on peut déduire du théorème général 
de 4.4.4 les conditions suffisantes de minimum faible. Le théorème 
correspondant a été déjà énoncé dans 4.4.2. 

Démonstration du théorème de Jacobi 
(théorème 2 de 4.4.2). Si l’on a les conditions fortes de Legendre et 


de Jacobi sur une extrémale admissible x (:) du problème (1), (2) 
de 4.4.4, alors, d’après la proposition 2, cette extrémale peut être 
inclue dans un champ d’extrémales qui recouvre un certain voisinage 
G du graphique de x (-). D'après le théorème 1 (ou 1”) de 4.4.4, 
l'inégalité 

li 

J@C)= ÎLE 20, r D) dt> 3 (E() 

lo 
est vérifiée pour toutes les x (-) € Clé: R”) qui satisfont aux 
conditions aux limites x (to) = x (lo), & (1) = x (£,) et sont telles 
que le graphique de x (-) est contenu dans G, le graphique élargi 
étant contenu dans V. Si [x (+) — x (:) ||: est suffisamment petit, 
lés deux dernières conditions sont satisfaites. Par conséquent x (-) 
donne au problème (1), (2) de 4.4.4 un minimum C'-local, ï.e. fai- 
ble. 5 
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Passons aux conditions suffisantes de minimum fort. Dans ce 
cas, les fonctions x (-) et x (-) elles-mêmes peuvent toujours: être 
supposées si proches que le graphique de x (:) est contenu dans G, 
mais æx(-) peut être arbitraire et le graphique élargi de x (-) 
n'est pas nécessairement contenu dans Ÿ. En dehors de ÿ, la condi- 
tion (1) ne garantit pas la convexité de la fonction £+> L (t, x, Ë) 
et l'inégalité de Young, utilisée dans la démonstration du théorème 1 
de 4.4.4 (voir la formule (7) qui s’y rapporte) n’est pas nécessaire- 
ment satisfaite. Par conséquent, il faudra introduire une hypothèse 


Supplémentaire (la condition de Weierstrass) sur la non-négativité 
de la fonction 


é (#, T, U, 6) = L (4, T, Ë) — L (t, T, u) — L. (6, T, u) (E — u) 


dans l’énoncé du théorème. 

Théorème de Weierstrass sur les condi- 
tions suffisantes d'extrémum fort. Supposons 
que la fonction L est de classe C? dans l’ensemble ouvert VER X 


X R° X R°, La fonction x(:) étant contenue dans C1 (Léo, t1l, RS) 
et son graphique élargi 


{20 20) 6e) 
dans Y. 
Si : 
1) x (-) vérifie l'équation d’'Euler 
d 7 T e 
FL: 0 =, (0: 
2) x(:) vérifie les conditions aux limites 
2(to)= To T4) =: 


3) on a la condition de Legendre forte (1) le long de x (-); 


4) on a la condition de Jacobi forte le long de x (:): il n'y a pas 
de points conjugués à t, dans le semi-intervalle (to, t.l; 

5) il existe un voisinage V = T pour lequel on a la condition de 
Weierstrass 


Et, x, u, Ë) >0 


1) Rappelons que si x (+) donne un minimum jort, la condition (1) étant 
remplie, cette fonction possède une dérivée continue, quoique maintenant le 
problème est envisagé dans KCT ([to, t,], R') (voir la remarque après l'énoncé 
du théorème 1 dans 4.4.4). 
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pour tous les (t, x, u, Ë) tels que (t, x, u) € V, (é, x, É)E V, 


alors (-) donne un minimum fort au problème le plus simple (1), 
(2) de 4.4.4 (et ce minimum est strict si l’on a € >> 0 dans la condition 
de Weierstrass pour ë -£ u). 


Démonstration. Définissons le voisinage Y = T° comme 
au début du présent sous-paragraphe ; construisons le voisinage 


G=ÎÛ— {(#, x (t)) [to LtLt,} et le champ d’extrémales qui re- 


couvre G:; sans perte de généralité, V — V. Désignons 2 u (t, x) 
l'inclinaison du champ au point (é, x) — (t, x (t, À)) € 


u (t, x) — x (4, À) pour x = xt, À), 
et soit 
pt, x) = Li (ti, x, u (6, &)). 
D'après la proposition 2 et l’exemple 1 de 4.4.3, la fonction p: 
G— R'* possède un graphique de Legendre 
Z = {(, x, pi, x) [(t, x) EG} 
contenu dans D. 


Maintenant, pour un x (+) admissible dont le graphique est con- 
tenu dans G,on a 


JS (&(-))— jo= ÎLE, x(t), x(t)) dt— 


— (tp 2 (0) 2088 (6 2 (0), pe 2 (D)} = 
Lo 


— | (é, x(t), z (t)—L. (,z(), ut, z())z (+ 


lo 
+L (be, (true z(D)—L(E, 2 (0, ut, z(D))}dt= 
lt 


= (8, z(,u( 20), (0) dt. 


to 
Puisque l’extrémale x (-) est contenue dans un champ, on a 
x(t)=u(t, x(t)) et donc 


J &(C)— | ® — [ B(, z(), u(£, x (1), 2 (#) dt=0. (14) 


Ÿ Fo 
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Par conséquent, 
li 


TeC)—-IEC)= (EG zut x), 2) dt (15) 
lo 
(comme dans le théorème 1 de 4.4.4, on a jo= fa) ; 


Las 


Ÿ 
Par construction (voir la démonstration de la proposition 2 dans 


4.4.5) les points (ft, (ét, À), ct, A) ={(t, x ut, a) EV = V 


pour ({, x) = (t, x (t, À)) € G, alors que (#, x (£), x (£)) € V puisque 
x (+) est une fonction admissible. Ainsi on peut appliquer la condi- 


tion de Weierstrass et l’on tire de (15) Ÿ (x (+)) — Y (x (-)) > 0. 
De la sorte, si x (+) € KC1([6,, t,l, R°) est admissible, vérifie les 


conditions aux limites et || x (+) — x (-) Ile est si petit que le gra- 
phique de x(:) est contenu dans G, alors Ÿ (x (-+)) > (x (-)). 
Par conséquent, x (-) donne un minimum fort pour le problème (1)-(4) 
de 4.4.4. 

L'égalité Ÿ (x (-)) = (x (-)) est possible dans ce cas seulement 
si ét, x(t), u(t, x (t)), x (t)) — 0 pour tous les t, sauf éventuel- 
lement les points de discontinuité de z () Su 6é 0, 


alors x (£) = u (t, x (t)), et en particulier x (-) s'avère continue. En 
outre, en vertu des relations (8) et (12) de 4.4.3, on a 


pt, =L,(t,z ut, s)<u(, 2 — 


=E(t, a, pa) ut, à) = pt, 2, pe = x (ti) = 
7 SE p (£, 6 9 (£), P (£, T (£))). 
La formule obtenue coïncide avec (12) de 4.4.4 et en raisonnant comme 
dans ce sous-paragraphe, nous voyons que x (t) = z (it). EH 
Remarque. La relation (15) permet de montrer que la fonc- 
tionnelle quadratique 
t; 
GEC)= |£(4,E, D dt 
lo 
à lagrangien (9) peut se mettre sous forme de carré complet. En cal- 
culant la fonction de Weierstrass (et en posant Ë (-) = 0), nous 
obtenons 
l1 
GEC)= |IPOË+POTIL. ONE" (IEP SE, (16) 


lo 
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où P (= L.. (t), tandis que E(-) et IT(-) sont les solutions du 


système matriciel 


Ë (+) = GP px (t) E + SE pp (é) I, 


; à A (17) 
IT (6) = — Sax (1) E— xp (t) 
à conditions initiales 
E (to) = 0, Il(to) = £. (18) 


4.4.6. Théorème de Nœther. Dans 1.4.1. nous avons déjà ren- 
contré des situations où l'équation d’'Euler possède une intégrale 
première. Par exemple, si le lagrangien ne dépend pas explicitement 
de #, i.e. est de la forme L (x, x), alors H = L.x — L = Cte (inté- 
grale d'énergie). Dans le présent sous-paragraphe, nous ferons con- 
naissance avec une méthode générale pour construire les intégrales 
premières des systèmes d'équations différentielles qui sont des équa- 
tions d’Euler d’un certain problème variationnel. Cette méthode 
se base sur un théorème à la fois simple et profond, démontré par la 
remarquable mathématicienne de notre siècle, Emmi Nœther. Le 
principe universel exprimé par le théorème de Nœther est souvent 
énoncé de la manière suivante: « Toute symétrie dans l’univers 
détermine une loi de conservation », ou encore : « L’invariance d’un 
système relativement à un groupe de transformations a pour consé- 
quence l'existence d’une intégrale première du système ». Aïnsi, 
par exemple, l’invariance d’un système relativement à une transla- 
tion dans le temps, qui s'exprime par le fait que le temps t n’apparaît 
pas dans le lagrangien, nous donne l'intégrale d'énergie. 

Passons aux définitions précises. Supposons donnée une famille 
d'applications 


Sa: RXR'RXR, lal<es 
Sault) = (Et, zx, a), Et, x, a)). 


Relativement à celle-ci nous supposerons que: 
1) les fonctions £ et X sont de classe C?; 
2) pour à —+ 0, 


T (t, x, a) = t+ aT(t, x) + o (a), 


& (, x, a) = x + aX (t, x) + o (a). “4 

Le champ de vecteurs (T (£, x), X (t, x)) sera appelé champ de 
vecteurs tangents de la famille {S,}. Sous l’action des transformations 
Sa le point P = (t, x) décrit une courbe dans R X R'et {T (£, x), 
X (t, x)} est le vecteur tangent à cette courbe au point P (i.e. pour 
a = 0; fig. 40). 
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Lemme. Soit 
x (+) EC? ([to, ta], R?). 


IT existe alors des 80, 8 > 0, x (+, +) € C? ((to — 6, t, + 8) x 
X (—e,e), R°), £&, (+) € C?((—e, e)), k=0, 1, tels que pour à € (—e, €) 


ne dus 





L ur (æœ) t, l, (æ&) 


Fig. 40 


l’image du graphique de la fonction x (-) est le graphique de la fonction 
æ (+, &): [to (a), t, (&)] — R°. On a alors 
Zi, 0) =zx(t), xt, 0) = X (t, x (t)) — x (£) T'(t, x (t)), (2) 
ti (0) = T'(é;, x (t:)). (3) 
Démonstration. L'image du graphique de x (+) par l’ap- 
plication S, se donne par les formules paramétriques 
t—=T(s, a) = Ts, x(s), a), bb <ES<Lt, 
z—=Y4(s, a) —=X(s, x(s), a), |a|l< £. 
Les deux fonctions + et x, étant les composées de fonctions de classe C? 


sont elles-mêmes des fonctions de cette classe. 
Conformément à (1), on a 


OZ OT 
7 G; T, 0) = 1, 5 L;, 0) =0, 


(4) 


et donc 


ôt OT dt OZ °,\ 
HS 0)= + (s) = 1. 





En nous servant du fait que le segment t, < s  t, est compact et 
la fonction 0t/0s continue, trouvons des nombres 6, > 0, e, 0 


tels que pour | «a | Le, et t, — ô, Ls<Lt, + 6, l'inégalité “(s, a) > 
>>1/2 est vérifiée. Alors pour « € (—e, e)fixe, la fonctions T (s, «) 
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est croissante monotone, appliquant [é,, t,] sur 
[o (a), li (œ)] En [T (Lo œ), T (£, a)] — 
= [Th z (to), à), Ets, x (ti), œ)]. (5) 


Il découle de ces deux égalités que ft; (œ), i — 0, 1, sont des fonc- 
tions de classe C*?, et (1) implique (3). 

En vertu du fait que l’application À définie par l'égalité À (s, &) — 
— (Tt (s, «&), &) est monotone, elle applique bijectivement le rectangle 

= (lo — O1, 1 + O1) X (—E1, E) 

sur son image W — À (II). Puisque le jacobien de À vérifie 

#4 0t/0a _ 1 

0 { 2° 

on peut établir, en raisonnant comme dans la démonstration de la 
proposition 2 de 4.4.5 (voir la partie B), que W est ouvert, tandis 
que l’application inverse A1: W — IT, qui est évidemment de la 
forme (£, a) (0 (f, &), &), est continûment différentiable et l’on 
a GE CI(W). 

On tire de (4) et (1) que t (s, 0) — & (s, x (s), 0) = s. Par consé- 
quent, À laisse sur place les points (s, 0), et il en va de même pour 
A”t, donc © (4, 0) = t. 

En outre, étant une fonction implicite, o (+, -)s’obtient de l’équa- 
tion F (6, t, à) = T(o, &«) — t — 0, d’où l’on tire, premièrement, 
conformément à (4) et (1), que 


Ou (é, 0) = —Fir, = — (x, (o (t, 0), 0), (o (4, 0), 0) — 
= — [TS (é, x (0, O) +8 (E x (6), 0x (IS (é, x (#), 0) — 
= —T (4, X (£)), (6) 


et, deuxièmement, la fonction F étant de classe C?, on obtient 0 € 
€ C?(W) en se servant de la remarque faite . " 3.4. 

Par ailleurs, À applique l'intervalle fermé {(s, 0) [4 << s <t1} 
en lui-même et cet intervalle est contenu dans W. Par conséquent, 
W contient le rectangle (t, — 6, t, + 6) X (—e, &) si 6 > 0 et 
e >> 0 sont suffisamment petits, et la fonction 


xt, «) = (Oo (t, æ), x (o (ft, «)), «) (7) 


est également de classe C? sur ce rectangle. Choisissons alors & 
pour que l'inégalité | &« | << e implique |é; (x) — t; |  ô. Alors, 
en nous rappelant la définition des fonctions © (+, -) et £; (:), nous 
voyons d’après (4) et (7) que l’image du graphique de x (- ) par l’ap- 
plication S, est le graphique de la fonction x (+, œ): [£, (œ), t, (æ«)] — 
ne R'. 


26—0237 
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Enfin, en prenant la dérivée de (7) et en se servant de (1), (6} 
et de l'égalité © (t, 0) — t, on tire 


ta (0) = IE, xt), O) HE, (4, x (6), O)x(tl 0, (t, 0) + 
HE (ze), 0) = rt) I—T(i (+ X (6, x (6), 


i.e. (2) est vérifiée. 

Définition. Supposons que la fonction Z: V — R est au 
moins continue dans l’ouvert V CR X R'" X R”. La fonctionnelle 
intégrale 

ti . 
JC to t)= |L(E, 2), x (0) di (8) 


lo 


est dite invariante relativement à la famille d'applications {S,}, 
si pour toute fonction x (+) € C? ([t,, £,1, R") vérifiant {(4, x (t) 


z (lo E<t<Lt}cY,ona 
J (x (-, à), tb (a), (x) = Ÿ (x (+), Los ta) (9) 


pour tous les & suffisamment petits. 

(Ici x (+, &), t, (œ), t, (&œ) sont construits en se servant de 
x (-) comme dans le lemme, et l'intervalle pour lequel on a (9) 
peut dépendre de x (:).) 

Théorème de Nœther. Supposons que les fonctions L, 
L,, L. sont continues dans l’ouvert V &R X R7 X R' et la fonction- 


nelle intégrale (8) est invariante relativement à la famille de transfor- 
mations de classe C*? vérifiant la condition (1). Alors la fonction 


? 


pl, æ, 2) = L. (t, x, æ) X (+, à) — 
LIL (a dr-L(z DT( (10) 


est continue sur chaque solution x (+) de l'équation d’Euler 
d e e 
a Li z(t), x(t))=Ls(e, z(), x ()) (11) 


telle que x(-)EC2(Ifo dl, R), {x (), rh t<t} CV 
L.. (-, x (-), z (+)) € C* (Léo» tal, R7*). 


Démonstration. A) Supposons que x (-): [é,, t,]— R? 
est la solution de l’équation (11) dont il s’agit dans l’énoncé du théo- 
rème. En nous servant du lemme, construisons la famille (x (+, @), 
to (@), t1 (œ)), où x (+, -) est une fonction de classe C? sur (t, — 6, 
t, + 6) X (—e, e). Fixons l'intervalle fermé À = [$, yl de manière 
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à avoir les inégalités &, — Ô << B <i, Lt, LYy Li, + Ô et pre- 
nons, s’il le faut, e si petit que | &« | < & implique les inégalités 
B< to (a) Lt (a) € Y. | 

Montrons que l’application D: (—e, €) + CT(A, R'7) X R? pour 
laquelle & > {x (+, a), to (&), t, (æ)} est différentiable selon Fréchet 
au point « — 0. Il est clair qu'il suffit de le vérifier pour la première 
composante a +> x (+, a). Ayant fixé e € (0, e), appliquons le théorè- 
me de la moyenne (aux applications différentiables a + x (t, a), t 
étant fixe), nous obtenons pour [a | << e& 


rt, a)—x(t, 0)—axa (t, 0) 





su < 
à Œ < 
<sup sup x, (t,c)—zx, (t, 0)|—- 0, 
tEA cE[0,«] 
sup T{ (£, @)— x} (£, 0)—atia (£, 0) < 
tEA Ce 





< sup SUP [Tia (#, c) — Lt (£, 0) | —- 0, 
lEA cE[0, x] 


pour à —+ 0 puisque x, et x;, sont uniformément continues sur le 


compact À X [—e, el. Par conséquent, dans l’espace C1 (A, R°) 
on à 


z(-, a) =x(-, 0) + ax, (+, 0) + o(la |), (12) 


ce qui signifie que cette fonction est différentiable selon Fréchet. 
En outre, il découle de (12) que 


D" (0) = {xs (+, 0), to (0), #1 (0)}. (13) 


B) Posons J(a) = (Y + D) (a) = J(x (+, «), to (a), t, (œ)). Con- 
formément à (9) on a (x) = (0), donc | 


J'(0) = J'(x (+), Los t1) ID (0) = 0. 


En nous servant de la formule (9) de 2.4.2 pour la dérivée d'une ap- 
plication intégrale, nous tirons de (13) 


0= J'(x(-), to, #1) [D' (0) = 
ti 
= {LE 2 (8), 2 (0) ca (8 0)+ 


+ L. (6, x (6), & (8) Gas (é, O)} dé + 
+ Lt, z(t;), x(t)) 4 (0)=4. (14) 


Par hypothèse, L. (&, x (1), z (&)) est continûment différentiable. 
En prenant l'intégrale dans (14) par parties (comme dans 1.4.1) 
26* 
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et en tenant compte de (11), (2), (3) et (10), nous obtenons 
OL. (6, & (ti), & (4) Ze (ss 0) + 
+ Lt a (6), à (6) ti (ONE = 
= [L. (6, a (6), à (6) X ( 2 (6) +(L (Es æ (ti), & (ti) — 
— Lt a (ti), 2 (6) 2 (8) T (és a (IE = 


= pt, st), c (és) — p (bo: & (to); Z (to). 


Ainsi 
plis & (ta), da (b)) = @ (bo Z (60), & (fo). 


En répétant ces mêmes raisonnements pour un intervalle fermé 
quelconque Ît,, it] &Ît,, t,], nous obtenons l'égalité 


pé, st), rt) = (to (to), x (to) = const. M 


Corollaire. Si dans les conditions du théorème de Nœther 
on a les hypothèses à) et b) de la proposition 2 de 4.4.3, alors la fonction 


VE zx p)=pX(, x — (zx, p)T(, x») (15) 


est sur chaque solution (x (t), p (t)) du système de Hamilton (1) 
de 4.4.3. 

La démonstration est laissée au lecteur. On voit de la 
formule (15) que l'intégrale première fournie par le théorème de 
Nœther est la valeur de la forme différentielle de Poincaré-Cartan 
© — p dx — SK dtsur le champ de vecteurs tangents à la famille {S,}. 

En guise d'exemple, montrons comment on peut obtenir les inté- 
grales d'énergie et d’impulsion (voir 1.4.1). Si L ne dépend pas de t, 
alors la fonctionnelle (8) est invariante relativement aux transforma- 
tions (é, x) > (t + «, x) (vérifiez-le !). Ici 7 = 1, X — 0, donc 


= L — L.x = — gg est constante. Si L ne dépend d'aucune des 


composantes du vecteur x, mettons de x;, alors la fonctionnelle (à) 
est invariante relativement aux transformations (#£, x)+- (t, x + ce) 
(vérifiez !). Ici 7 = 0, X — e,, on a donc œ@ — Le, = L 

D'autres exemples d'application du théorème de Nœther seront 
donnés dans le sous-paragraphe suivant. 


Xp" 


4.4.7. Principe variationnel et lois de conservation en mécanique. 
Considérons un système de n points matériels (« particules ») de 
masses My, - . +, Mn li = (X;, Y;, Z;) étant le rayon vecteur du 
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i-ième point. Pour simplifier les notations, posons 


Ô 0 0 
Ps OR, = | 3... he 


0r; ? ÔTn 


4 __f 0 ô 0 | 
Ôr; 0x; ? Oys * 02; 1° 
Nous supposerons que l'interaction des particules entre elles et avec 


le milieu externe se décrit par l'énergie potentielle U ({, r), de sorte 
que les équations horaires sont de la forme 








mir = Fi; = —OUlôr;. (4) 
L'énergie cinétique du système se détermine par l'égalité 
n 
À = e . 
KZ Sim (rilri). (2) 


i=1 
Théorème (principe variationnel de La- 
grange). Les équations horaires d'un système mécanique sont les 
équations d'Euler du problème variationnel 
li 


\£ (t,r, r) dt extr, (3) 
to 
FL) = 79 FC) TS L = K — U. 
Démonstration. On tire de (1) et (2) 
Fe d d 0K d OU 
HG Ie Ton ee 


La signification de ce théorème dépasse de loin le cadre de la 
situation la plus simple à laquelle nous nous sommes limités. Les 
physiciens et les spécialistes en mécanique décrivent très souvent les 
propriétés du système en donnant explicitement son lagrangien Z. 
Alors K,U et L = K — U peuvent être exprimés non seulement en 
coordonnées cartésiennes mais aussi en d’autres coordonnées, le la- 
orangien peut également contenir des termes qui décrivent des forces 
magnétiques ou gyroscopiques (non potentielles), etc. Dès que le 
lagrangien est donné, les équations d’Euler du problème variationnel 
(3) déterminent la loi du mouvement du système considéré. 

L'approche variationnelle est commode parce qu’elle permet en 
particulier d'obtenir des intégrales premières (les « lois de conserva- 
tion ») en se servant du théorème de Nœther. Nous donnerons des 
illustrations de cette méthode sur les exemples des intégrales dites 
classiques: d'énergie, d’impulsion et de moment d’impulsion. 

a)Ssystème conservatif. U ne dépend pas de £. 
Groupe de transformations: (£, r) +> (t+ œ,r). La fonction 
r (+): Léo, t1]— R° est alors appliquée dans la fonction r, (-): 
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Ho + a, ts + al R%",7r, (t) = r(t — a). La fonctionnelle (3) est 
invariante 


t1+@ | thi+a | 
Î L (ra (#), ra (0) dt= | L(r(t— a), r(t— œ)) dt = 
to+o to+@ 


li 
=. ÎL (r (&), r (#)) dt. 
to 
Champ vectoriel tangent: T —1, R—0. Intégrale première: 
n n n un 
p= D L.R;—-[>' Ler,—LlT=— m,(r;lr,)+K—U=-K—U. 
a it Mi i=1 
Par conséquent, dans un système conservatif l'énergie totale 
GR =K+U 
est une intégrale première («loi de conservation de l'énergie »). 
b) Particule libre: U ne dépend pas du rayon vec- 
teur r, d’une des particules. Groupe de transformations : 
(Loan less nes M) el Ti sec oo sr) 
où LE R est arbitraire. L’invariance de la fonctionnelle (3) est 
évidente. Champ de vecteurs tangents: 
PUR = 4 Rires Resa ess Où 
Intégrale première : 


n K : 
p= DL. RE mx (rad). 


t TR 





i=1 


L étant arbitraire, p, —=mxr, doit être constante. Ainsi, si la k-ième 
particule n’interagit pas avec le reste du système (ne contribue pas 
à l'énergie potentielle), son impulsion p, — myr, est conservée. 

c) Absence de forces externes. Cela signifie que 
U dépend seulement des différences r; — r;et L ne change pas si le 
système, comme corps rigide, est déplacé dans l’espace, i.e. si l’on 
effectue la transformation 


(ru Mme (6, r + al, ..., rn + ob), 
où / est un vecteur quelesrque: Ici Fe R=(l,..., D et la 


)= mt). | étant arbi- 





quantité invariante est > (— 
ôr; 


traire, on «à 


ñn 
P — murs — const. 
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Ainsi, si les forces sont toutes internes, on a la « loi de conserva- 
tion de l'impulsion totale du système ». 

d\ Symétrie de rotation: U dépend seulement des 
distances entre les couples | r; — r; |. Le lagrangien ne varie pas si 
l’on effectue une transformation orthogonale ©, puisque 


L(O@r;, Or;)=K —U — 


n 
À e e 
ME: >» m; (Or;|Or;) —U (1Or: — Or;l) = 
i=1 
À e e U 
= di Mirilrs) —U (ri—r;l) 
i=1 

(toute transformation orthogonale laisse invariants les produits 
scalaires et les longueurs). Fixons le vecteur & et considérons le 
groupe de transformations qui correspond à une rotation uniforme 
du système autour de l’origine à vitesse angulaire ©. Champ de vec- 


teurs tangents: 7 — 0, R = (© X r,, ..., © X r,). Intégrale pre- 
mière : 
n aL n n 
D D —— À; — D m;(r:lo Xr;) = D m;(r: Xrilo). 
i=1 Ôri j=1 i=1 


&@ étant arbitraire, le vecteur moment d’impulsion 
n e 
M — 2 m;r; X Tr; 
1—= 


est invariant, on a donc la « loi de conservation du moment d’impul- 
sion ». 
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Nous avons réuni ici 100 problèmes. Ils ne sont pas disposés en ordre crois- 
sant de difficulté, mais en groupes thématiques. Au début nous considérons des 
problèmes à contenu géométrique (n°8 4 à 14, 22, 23) inspirés par les problèmes 
d’Euclide, Kepler, Steiner, Apollonios. 

Il y a toute une littérature consacrée aux relations extrémales en géomé- 
trie. Le lecteur pourra trouver beaucoup de problèmes intéressants dans le livre 
de Chkliarski, Tchentsov, Iaglom Znégalités géométriques et problèmes de maximum 
et minimum, Moscou, « Naouka », 1970. Pour la majorité d’entre eux la solution 
standard (pour une formalisation appropriée) n’est pas plus difficile que la solu- 
tion « géométrique ». 

Les problèmes n05 15 à 21 se rapportent au thème Jnégalités. Ici aussi le 
lecteur pourra augmenter la liste des problèmes en s'adressant cette fois au livre 
de Hardy, Littlewood, Polya Jnequalities, Cambridge, 1934. 

Les problèmes n°05 24 à 30 se rapportent à deux thèmes de la théorie des 
approximations : Polynômes les plus proches de zéro et Inégalités pour les dérivées. 
Dans la théorie des approximations les problèmes d’extrémum occupent une 
place de choix, et la majorité les problèmes résolus possèdent également la 
solution standard. Une série de problèmes de la théorie des approximations est 
étudiée dans le livre de Tikhomirov [111]. 

Les problèmes n°5 31 à 100 ont été choisis parmi ceux que nous proposons 
dans les séminaires accompagnant le cours de Commande optimale à la faculté 
mécanico-mathématique de l’Université de Moscou. Les problèmes plus diffi- 
ciles sont marqués d’un astérisque. 

Nous voulons faire remarquer au lecteur que l'idéologie de la commande 
optimale permet d'étudier très simplement et de manière complète la majorité 
des problèmes du calcul des variations classique (voir, par exemple, la solution 
du problème de Didon n° 55, le problème sur l’oscillateur harmonique n° 47, 
etc.). 
Tous les problèmes sont munis de réponses (ou de renvois bibliographiques 
où la solution peut être trouvée), nous avons donné des indications pour la 
do de nombreux problèmes. Les solutions des problèmes clés sont com- 
plètes. 

1. Trouver un point de l’espace euclidien de dimension n tel que la somme 
pondérée des carrés des distances (à poids positifs) de ce point à un certain 
nombre de points fixes soit minimale. 

2. Résoudre le problème 1 lorsque le point cherché est situé sur la sphère 
unité. 
3. Résoudre le problème 1 lorsque le point cherché appartient à la boule 
unité. 
4. Trouver un point du plan tel que la somme pondérée des distances (à poids 
positifs) de ce point à trois points distincts soit minimale (problème de Steiner 
généralisé, comparer à ce problème dans 1.1.2). 

5. Trouver un point du plan tel a la somme des distances de ce point 
à quatre points distincts soit minimale. 
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6. Inscrire dans un cercle unité un triangle dont la somme des carrés des 
côtés soit maximale. 

7. Inscrire dans un cercle unité un triangle dont la somme pondérée (à poids 
positifs) des carrés des côtés soit maximale. 

8. Inscrire dans une sphère de rayon unité de l’espace euclidien de dimen- 
sion » un cylindre de volume maximal (problème de Kepler généralisé, comparer 
au problème de Kepler dans 1.1.2). 

9. Inscrire dans une sphère de rayon unité de l’espace euclidien de dimen- 
sion #7 un cône de volume maximal. 

10. Inscrire dans une sphère de rayon unité de l’espace euclidien de dimen- 
sion » un parallélépipède rectangle de volume maximal. 

11. Parmi tous les simplexes dont un sommet est situé au centre de la 
sphère unité, tandis que les autres sont contenus dans cette sphère, trouver 
celui dont le volume est maximal. 

12. Inscrire dans une sphère de rayon unité de l’espace euclidien de dimen- 
sion » un simplexe de volume maximal. 

13. Inscrire dans un triangle donné un triangle dont la somme des carrés 
des côtés serait minimale. 

14. Trouver la plus courte distance d’un point situé en dehors d’un ellip- 
soïde de l’espace de Hilbert 1) à cet ellipsoïde (problème d’A pollonios généralisé, 
comparer au problème d’Apollonios de 1.1.2). 

n œ ñn 

15. [| Zj À —> SUP; D a;x;=0, tr s0, dt 1=1l.:;:.n; 

i=1 i=1 
où les «; sont des nombres fixes. 

Déduire de la solution de ce problème l'inégalité entre la moyenne arithmé- 

tique et la moyenne géométrique. 


n n 
16. D'islr—sup; Àlal=1, 
i=1 i=1 


p >1, g > 1 étant des nombres fixes. 
Déduire de la solution du problème l'inégalité pour les moyennes exponen- 
tielles ?). 
n n 
2 
17. Si djX; 7? SUP; >. 211, 
i=1 i=1 
où les a; sont des nombres fixes. 
18. (alzx)— sup; (cizx) = 1, 


H étant un espace de Hilbert, a, un élément fixe de X. 
Déduire de la solution des problèmes 17 et 18 les inégalités de Cauchy-Bou- 
niakovski dans R? et dans un espace de Hilbert. 


n n 
19. > djX; 7? SUP ; > | RE 1 


où p est un nombre fixe, p > 1. 


1) On appelle ellipsoïde de l’espace de Hilbert Æ l’image de la boule unité- 
par l’application linéaire continue À de l’espace en lui-même telle que Im A — 
— H 


— 


2) On appelle moyenne exponentielle à exposant p -£ 0 des nombres non: 
ñn 


négatifs ay, ..., an l'expression (> aP/n)1/?. 


i— 
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Déduire l'inégalité de Hôlder de la solution du problème. 

20. Parmi toutes les variables aléatoires discrètes qui prennent n valeurs, 
trouver celle qui a la plus grande entropie 1). 

21. Parmi toutes les distributions de probabilités absolument continues 
sur la droite R à espérance mathématique et à variance données, trouver la 
variable aléatoire à entropie différentielle maximale ). 

22. Trouver la distance d’un point donné £ dans R? à l'hyperplan 


n 
D. ajt; = 0. 
i=1 

23. Trouver la distance du point & de R? à la droite qui passe par le point n 
de vecteur directeur E. 

24. Parmi les polynômes de la forme #? + ot + «, trouver celui qui dif- 
fère le moins de zéro dans l’espace Z, ([—1, 1]). 

25. Parmi les polynômes de la forme £ + quil EL ,,,. + a, trouver 
celui qui diffère le moins de zéro dans l’espace Z, ([—1, 1]). 

26. Parmi les polynômes de la forme £n + œét-1 EL... + ax, trouver 
celui qui diffère le moins de zéro dans l’espace C ([—1, 1]). 

27. Parmi tous les polynômes trigonométriques non négatifs de la forme 
z(t) = 1 + 2p, cos t + ... + 20, cos nt trouver celui pour lequel le coef- 
ficient p., est maximal. 


28. x (0) —> sup ; | (x2+ (x00)2) dt L1. 


O0 
29. | 22 dt —> sup; (@ tard. 
0 


Der Q 


a T 
30*. | (x)? dt —> sup; x? dt Yu 


TH 


JT 
| (MP dt Ey, 2D(—m=rD (mn), j=0,1,..., n—1, <a 
— I 

(Toy 0) 
1.2 (x? x) dt — inf. 

(0, 0) 


1) On appelle entropie d’un ensemble de nombres positifs p1, . . .,; Pn» 
n 
dont la somme est égale à un, le nombre H — > p; Log 1/p;. D'une manière 


i=1 
analogue, on appelle entropie différentielle d’une fonction positive p (+), dont 


l'intégrale est égale à un, le nombre — | p (x) Log p (x) dx. 


R 
2) Les conditions aux limites sont indiquées par les limites d'intégration 
x (0) = 0, x (To) = 0. Dans le problème suivant (n° 32), x (T,) est libre. Nous 
écrivons 7, lorsque le temps est fixe, et 7, lorsqu'il est libre (voir, par exemple, 
les n0S 71, 76, etc.). 
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To 
32, | (x? x) dt — inf. 
(0, 0) 
To 
33. (a2Lr)dt— inf; [r|<1. 
(0,0) 
(Tos.0) 
34. a a 
(0,0) 
(2, 1) 
35. À #24 — int. 
(1, 3) 
(1, 1) 
36. t2r2 dt — inf (exemple de Weierstrass). 
(0, 0) 
(1, 1) 
37. 12/3852 gt — inf (exemple de Hilbert). 
(0, 0) 
CO 
38*. PR sp &;, BER (exemple de Hilbert-Weier- 
(0, 0) 


strass généralisé). 


(1, 1) 
39. | (22— x) dt — inf. 
(0, 0) 
(2, 1) 
40. (tx?— x) dt — inf. 
(1, 0) 
(1, 4) 
Al. (a? xx + A21x) dt — inf. 
(0; 1) 
(Tor #) 
42. © (x? x?) dt — inf. 
(0; 0) 
(Toy ©) | 
43. | Oètadt— int; [21<1. 


(0, 0) 
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Ho 
44. Fe +21) —int 





(1, 8) 
45. | ((Iz|—1)2+ x?) dt — inf. 
(—1, E) 
46*, | xidt— int, |r1<1, +(0)=1. 
0 
(Tor Ë) 
47. (x2— x?) dt — inf. 
(0, 0) 
T 
48. | (x?— x?) dt — inf. 
(0, 0) 
(To, 0) 
49%. (x?—x2)dt— inf; [x|<f. 
(0, 0) 
(Tos 0) 
90*, (([x | —1)?— x?) dt — inf. 
:(0, 0) 
(is X1) 
51. int #0 
x? 
(los Xo) 
To 
52. | x? dt— ax? (To) — inf; zx(0)—=0. 
1) 
1 1 
53. | ete | SU SOL 0 
0 0 
(To; 0) To 
54. | 24 ii; | a <1. 
(0, 0) t 
Te sy — 
99. | x dt — inf; | V 1+z2dt<l, z(—To)=2x(7,)=0 (problème 
de Didon). 
To Le 
(rt, 0) TT 
06. | x? di — inf; | xsin t dt=1. 
(0, 0) 0 
(1, —14) 1 1 
57. x? dt —s inf : | Tai =1,5, | ix dt — —2, 
(0, 2) 0 0 
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(1,4) 1 
58. 2? dt — inf; tx dt 0. 
(0, —4) 0 
1 
59. at dt — int; x(0)=x(0)=0, x(1)=1. 
0 
1 
60, ardt int; t(0)=1, +(0)=0. 
0 
À 
61. | sd — int; —hLT<2, x(0)=1, +(0)=0, +(2)=—2. 
0 
To , 
62. | cdi inf; [rl&A  x(0=r(7)=0. 
0 
To 
63. \zxdt—int: |[r|<1, 2(0)=2x(0)=x(7)=0. 
ù 
He 
64. | dt int; Ir|<Ai, x(0)=x(0)=x(7o)= x (To). 
0 
1 
65*, | zdt— inf: |aM]<l, 26 (0)=0, k—0,1, ... n—1. 
—1 
1 1 
66. | +at— int; [rain z(0)=1, x(0)=—4, 
0 0 
2 
67. zx(2)—>sup; |r|<2 x(0)—0, x? dt —2. 
0 


68. T—>inf; —1<r<3, x(0)}—1, v(0)=x(7)=0, x(T)= —1. 
69 T—inf; r|<il, æ(0)—E, z(0)=E, æ(T)—0. 
70. T—inf; Ir|<i, æ(0=E, æ(0)=ËÉ, æ(7)=x(T)=0 
(problème élémentaire de temps minimum). 
T 
71. T— inf: | at, 00 OT. Det: 
0 


7. T— inf; [21 &2, x(—0= 1, 2(—1)=0, 2(T)=1, 2 (T)=0. 
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73 T—inf; z+r=u, lui, +(0)=E, 2(0)=E, 
x (T)=zx(T)=0. 
7%, Tin; shamu, ul<i, 2(0=6, z(0)=&, 
22(T)+a2(T)=R?, HER? 
75%. T—inf; x+({—eu)z—0, x(0)=E, æ(0)—E,, 
22(T)Lat(T)=i, Oui, 0<eci. 


T 
76. 1) | 22 dt — extr ; z(0)=0, T+xz(T)+1—0. 
( 
1 
77. Tdi Sups À x [S1, x(0)—0 (trouver toutes les ex- 
0 
trémales). 
To 
18. [@+anat— int; 2:(0=20=0 :(7)=E% ATo=8. 
0 


79. | (a?—xt)dt inf; x(0)=x(0)—0, z(T)=—0, æ(Ts)=0. 


80. | (22—x2)dt+inf; 2(0)=+(0)—0, x(7)=E, 2(To)=E. 


81. | a?dtinf; r|<&1, z2(0)—=7(0)=0, æ(1)=—1,. 


82. | z2dtinfs 7>6 +(0)=7(0)—0, zæ(2)}=17. 


83. | (x?—48x) dt inf, zx(0) —zx (1) —0. 


84. 


To 
22 dt inf; | = (G)= x (0) = 0. 
0 


85. u? dt+ x? (0) — inf; D dy: x (2)= 1. 


e 
O 7 7 à ND ot, 5 One ON On, en ot, 5 ot 5 


1) Ici Z est libre, voir la note au n° 31. 
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87. | u?dt+4x?(2)— inf; (0)=1, 2+4r7=u. 


88. 


89. 2 


zo (1) = 2 sin 1 sh 1. 
1 


0 
nU=t, (= —8. 


M. Hullpqoininft 2=u, xæ(0)=9, z(0)=0, 


x (1) =, x (1) = Ee. 
To 
92*. | lx—gldtinfs 2(0)=, +(0)=v%, 
0 


BIT = Ty, x (To) = 01, fx ER? (problème de Goddard). 








(f1: X1) 
93. XV itadt inf, aœ<o. 
(to, Xo) 
(t1, 8) 
94. | xVirza int. 
(to, £) 





T . 
95. [EE à inf (OT, T1 (T)=1t4 
0 
T 
96. | (4e fé1) dt inf r(0)=E, r(0)=E, 
0 


z(T)=z(7)=0, rl. 


u? dt+ x? (0) —+ inf; PR x (2) = 1, x (2)=0. 


u? dt4r? (2) inf; æx(0)=1, zx(0)=0, r+Lér= vu. 


ee K 
(EE mure) dt + inf; T1 (0)= 9 (0) = x; (1)= 0: 


{ 
90. | (xt, + To) dt —+ extr; | Tite 0, T] (0) = z (0) — 
0 
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416 PROBLÈMES 
97%. | |ujpdtinfs vLur—0, æ(0)=r(1)=0, æ(l)=1, p>i. 


98*. | lu[dt>inf; xtur—0, x(0)=æ(1)=0, x(0)=1. 





99%, (V 24234 V'Éa tj? (x cos re) dt inf; 


T1 (0)= x? (0)—0, 1(To)—$1 To (To)—E2 (problème d'Ulam). 
To 


; ct x xt 
100*. | +) dt—sup; x(0)=re,, x(7,)=1, 


€, g, y étant des constantes positives (problème de montée maximale d’une 
fusée). 


INDICATIONS, SOLUTIONS ET RÉPONSES 


Convenons de certaines abréviations: SP — solution du problème, I — 


indication, F — formalisation. Par x (y, z), etc., nous désignons la solution 
du problème, par S, sa valeur. Si le problème dépend de certains paramètres, 
on écrit la fonction S$ comme une fonction des paramètres correspondants; 
T, signifie que le temps est fixe, si l’on écrit 7 dans l’énoncé du problème, cela 


signifie que le temps est variable, T est le temps optimal. 


1.1: > milx—x;l?—inf, x, x; ER*% est le problème différentiable 
élémentaire; FN mir;/D) mi est le centre des masses. 
2. F: Diomilxz—xl?—inf, [rl=1, x, x; €R?, z=x/|xl si r 0, et 
x, |t|—1, est quelconque si x—0; x est le centre des masses. 
3 zx Si [x LA, x—x/|x| si [xl 1; x est le centre des masses. 
3 


Bb F:f(x)= D milz—ril inf, x, 2: ER?, i=1, 2, 3, est le problème 


i=1 
convexe élémentaire. SP: x existe = 0 € ôf (x). Si x é {x;, do, te}, alors 


af (x) = [> m; (x—r;)/|r—7; | | — {0}, et cela signifie que l’on peut construire 
un triangle dont les longueurs de côtés sont m1, m, et m3. Soit &;; l'angle de 


ce triangle formé par les côtés de longueurs m; et m;. Alors x est l’intersec- 
tion des trois cercles soutendus par les cordes [x;, x;] d’angles x — @;;. Si 
le triangle à longueurs de côtés m1, m, et m;, n'existe pas ou si la construc- 
tion décrite est impossible, alors la solution x coïncide avec un des sommets 
du triangle. 

5. Indiquons la réponse dans le cas principal, lorsqu'aucun triplet de points 


de l’ensemble {x1, x, x, æ,} n’est situé sur une même droite. Alors x est 
l'intersection des diagonales, si le quadrilatère à sommets x; est convexe; 
c'est le sommet intérieur de l’enveloppe convexe dans le cas contraire. 

6. F: [mm — 2 + —-ef+lx — el — sup, | +Izx (= 1, 
e = (1, 0), x; € R?, i — 1, 2. Le problème possède six points stationnaires ; 
(t1: To, e) constitue un triangle équilatéral. Pour une résolution détaillée, voir 
le livre [69], p. 443. 

7. Fi: ml — 2 +mlm —el + melzs — el? —+ sup; | x |? = 
— | x, |? = 1. S'il est possible de construire un triangle de côtés mime, mom 
et momo, et a, à, sont les angles entre les côtés de longueurs | mom |, | Mama | 


A 
et | mime |, | mom, | respectivement, alors l'angle entre x et e est égal à x — «4, 
27-0237 
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tandis que l’angle entre x, et e est égal à x — &,. Si la construction est impos- 
sible, alors x, = x, = —eou x, = —e, 2 = e. 
Dans les problèmes 8 et 9, diverses formalisations sont possibles, selon la 


manière dont on comprend les termes « cylindre » et « cône ». Ici, par la suite, 
un cylindre dans R? est le produit d’une boule de dimension n — { par un seg- 
ment orthogonal, le cône dans R' est l'enveloppe convexe d’une boule de dimen- 
sion r — 1 et du segment (issu de son centre) qui lui est orthogonal. 

8. x est la moitié de la hauteur du cylindre, égale à n-1/2. 

9. x est la différence entre la hauteur du cône et le rayon de la boule, égale 
à ni 
10. % est le cube de dimension n. 


11. x est le simplexe dont n côtés forment une base orthogonale et dont les 
longueurs sont égales au rayon de la boule. De la solution de ce problème et de 
l’homogénéité, on déduit l'inégalité d'Hadamard: 

n 


[et (anP< [| (5 a;): 
i—1 = 


Pour plus de détails, voir [69], p. 444. 


12. x est le simplexe régulier. 
13. F:[xz—yP+ly—-2P+1z-2zF- inf; (la) <0, (Ib) < 


O0, lh+as0,a—>0,a+b+e— 0; a, b, c, x, y, z € R. (L'origine 
des coordonnées coïncide avec le sommet C'; a, b et c sont des vecteurs normaux 


à [BC], [CA] et [AB] respectivement ; x est l'intersection des droites (x | a) = 0 
et (x|b) — B(b —al|b); y, celle des droites (y | b) — 0 et (y | a) — 
er A 2 = (2 + V2 + 38 (a + bV2; B = 24/81 a + 8 P + 


14. F: [lro—Ell— inf, £= Ay, [lvl & 1, Ê= Ay, où y=(A*A+ AI) 1 At, 
tandis que À est l’unique solution positive de l’équation J[(A*A-AZ) A*xol|—1. 

15. &=...=2%n—0/ D &;. De la solution du problème et de l’homo- 
généité on déduit l'inégalité 

X : (eÆ 
nat (Doœn/Da)2t (>0 &>1) 
Pour à; — {/n, on obtient l'inégalité entre la moyenne arithmétique et la moyenne 
géométrique : 
n n 
(Ia) P<(S x)/n #20. 
i=1 i=1 
16. x = —He;, OÙ e1, . .., en est la base standard dans R? lorsque g < p; 


LT ., n/a) si q > p; le cas p = q est trivial. De la solution 


re 1 
z— (+n 
de l’homogénéité, on tire l'inégalité des moyennes exponentielles 


de ce problème et 


n 
a>p=op(r)<oqg(rh Gp(r)= (D zP/n) PF, 2, >0. 
11 


n 
17. r=(afS a} 72. De la solution de ce problème et de l’homo- 


i— 
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généité, on tire l'inégalité de Cauchy-Bouniakovwski : 
| à a;X; | < (5 a?)"/? (5 a3)1/2. 


18. x — a/|al. De la solution de ce problème et de l’homogénéité, on 
tire l'inégalité de Cauchy-Bouniakovski. 


Am , , 1/2 | 1 
19. Pour p > 1: x; = a? ne \la;[P | — + —1, De la solu- 
P i : > il D TD 
tion de ce problème et de l’homogénéité, on tire l'inégalité de Hôlder 


[Dar |<(S ar) PS lalP) 7, Ap+t/p=1. 
Pour p—1, 
2, _fsigna Si al=llal=max(lal,..., lanl}, 
Vo si Jal<llall. 


n 
20. F: > Pi Log p; — inf, >, pi=1, p;>0.p;—=1/n est la distribution 
i=1 j 
uniforme. 


21: FE: | p (x) Log p (x) dr —+ inf, À p (2 dx = 1, 
R R 


er (x) dx= a, | (x— a} p(x)dr=0?, p(r)>0, 
R R 
c'est le problème de Liapounov. 


SP: &= | [hop (2) Log p (+ up (e)-+harp (e) + (e— a)? p (a)] dx. 
R 
Condition d’extrémum pour P(:): 


#m 


hop Log p+up + hrp + À (x— a)? p > 
> op (e) Log p (e)+ap (r)-+haep (2) + Ês (2— a)? p (0). 


On en tire que À -£ 0 et p(a)=e(aix+bix ter) où a, b, et c., sont choisis 
conformément aux contraintes, d’où l’on obtient 
_ (a)? 
p(æ)=(2no)"!/2e 29 
c'est la distribution de Gauss. 


2, S=[ at —0|(D at) 2. 
23. S=(lË—nl—(E—nlé/161)) A. 


24. x () = #? — 1/3. I: aux problèmes 22 à 24: de tels problèmes ont 
été étudiés dans 3.5.3 (le problème 24 peut être traité comme celui de la plus 
courte distance de la fonction #? au sous-espace lin {1, #}). 

1 


25: F: | a? di int, LU ="! 
1 





1 
hot? 
SP: £— L + p (en) } dr. 
1 
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Equation d'Euler-Poisson p(® ()+(—1)7 hot=0: conditions de transversalité: 


pa (E 1)=0, k=0,1,...,n—1, \—0= p()=0, 
a = 15 AM = (— 1) 26m) (— 1) nl, PAR RE ES 
2 (= (AP DO (D = = (n1/(2n)1) (d/de)" (21). 


Lorsqu'on démontre la suffisance, on peut se servir du fait que le problème est 


convexe. 
26. F: f(x)—max {f (4, x)} —+ inf, 


fé, x)=|t+ Ÿ zth-1| 
k=1 


est le BEOBISIRe convexe élémentaire, qui possède une solution. La fonction 


z(=m+ ÿ zpth-1 atteint son maximum en valeur absolue en s < n +1 
k=1 
points, car sis > n + 1, alors x (-) possède au moins n zéros dans l'intervalle 


ouvert (—1, 1), ce qui est impossible vu que deg x (+) — n — 1. Désignons ces 








points Lea w nr Ti UT Le... LT. Si x (-) est la solution, alors 
DE ôf (x) == conv (0j (r1, 2), 8 (ts 2) > Ju, de >0, 
D dr =, D G; Sen £ (T )-T: 0, k=0,1,...,n—1. 


i=1 il 


On déduit de la dernière relation que s = nr + 1,i.e. z( -) atteint sa valeur maxi- 
mum et minimum en » + 4 points. Alors parmi ces points on doit avoir les 


deux points +1 (car autrement 2 (-) aurait à nouveau au moins » zéros dans 
(—1, 1)). Mais alors (1 — #2) x? (4) et f? (x) — 7? (t) sont des polynômes de 
degré 2n, qui possèdent des zéros d'ordre un aux points %, — —1, t,,1 = 1 et 
des zéros d'ordre deux aux points To Te 2e Ainsi (en égalisant les coeffi- 
cients des termes en f?*), nous obtenons l'équation (1 — #2) 72 = n? (f? (x) — 
— x? (t)) dont la solution sera x (4) = 2-(2-1) cos (n arccos t). 

Maintenant on calcule facilement &h (ce qui nous servira par la suite): 


= Ans = (2n)"1, a; =1/n, =, ee; n— 1. 


On déduit de ce que nous avons démontré l’importante égalité 
1 


| sen r(t)th dt=0, k—0,1,..., n—1. 
_1 


27. Pr = — cos xt/(n + 2). I: d'après le théorème bien connu de Riesz, le 
polynôme non négatif trigonométrique x (-) a la ARR ENS 


z (t)=1+20, cos t+ ..,+2p} cos nt = | D æetht Fe 
R=0 


où les x; sont des nombres réels. Alors 
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Il faut ensuite appliquer la règle des multiplicateurs de Lagrange. Pour plus 
de détails, voir [111], pp. 113-114. 


n R;t 
je \ kje 

28. 2(= dan 

j=1 (D) ks)p'(k;) 
s=1 
où les 4; sont les racines de l’équation x(7%) + (—1)7 x = 0 situées dans le 
demi-plan AU tandis que p (z) = (2 — ki)... «(2 — k,). Pour plus de 
détails, voir le livre [111], pp. 121-128. 

29. x (t) = Ae-t/? sin (t sin x/3 — x/3), où À est choisi de la condition 
isopérimétrique. Pour la solution du oee voir le livre de Hardy, Little- 
wood et Polya cité plus haut. La solution du problème général à inégalités 
pour les dérivées s’obtient par une application directe du principe de Lagrange ; 
voir l’article de Bouslaïev ?). 

30. S = Y1P1 + YoPer OÙ Pr, Pa vérifient le système 


pitsp= sh, pa +(s +1) p, = (s + 1), 


avec s = [(y2/y1)/2%-0)], [ ] étant la partie entière. I: Il faut développer la 
fonction x C en série de Fourier et réduire le problème à un problème de pro- 
grammation inéaire. Pour plus de détails, voir l’article de Din Zung et Tikho- 
mirov ?). 

Indication aux problèmes 31 à 100. Dans la majorité des problèmes qui 
suivent, la démonstration du fait que la solution x (+) trouvée est un abs min 
peut être obtenue soit par une analyse directe des valeurs de la fonctionnelle 


aux points x (-) et x (+) + h (:) (dans ce cas nous écrivons « se vérifie directe- 

ment »), soit par une démonstration indépendante de l'existence de la solution. 

Dans le deuxième cas, on peut se servir du théorème d'existence suivant pour le 

problème le plus simple du calcul des variations classique à contraintes sur la 

dérivée; ce théorème se déduit des résultats généraux exposés dans [46] 3). 
Supposons que dans le problème 


t1 
| L(&, x (t), x (é))dt— inf, x(to)=2,, x(t1)—=2%1: Ix| < À (+) 
to 


l'intégrante L est une fonction continue sur [é,, t1] X R X [—4, A], la 
fonction E—+ L (t, x, Ë) étant convexe; alors il existe une fonction absolu- 


ment continue x (-) qui donne un minimum au problème (x). 


L'introduction de la contrainte « forcée » | x | & À (qui donne la possibilité 
de garantir l'existence de la solution), suivie d’un passage à la limite quand 
A — o, sera appelée « méthode de contrainte forcée ». 


31. x (9 = (2 — Tot)/4 est un abs min. 
32. z(t) = (2 — 2T,t)/4 est un abs min. 


1) Bouslaïev A. P., Sur un problème d'extrémum lié aux inégalités concernant 
les dérivées. Vestnik MGU, ser. matem., 1978, n°0 3, pp. 67-77 (en russe). 
| ?) Din Zung, Tikhomirov V. M., Sur les inégalités pour les dérivées dans la 
métrique de Æ£,. Vestnik MGU, ser. matem., 1979, n° 5, pp. 7-11 (en russe). 
3) Voir également Fleming W., Rishel R., Deterministic and stochastic 
optimal control. Heidelberg, 1975. 
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83. x (t) = (2 — 2Tot)/4 si To 2; 














L —t pour 0O<t<To—2, 
] = — _— 9)\2 
si To>2, z(t)—={ t(t 270 n = DE Si mme 
Dans tous les cas x (:) est un abs min. 
84. z(t)=(#2—Tit)/4 si To <4: 
[ 4 pour pére 
Do EC) ie) PA T4 
si > 64, z (= À = ee pour —<i<S—, 
(iT pour ot SLST, 


Dans tous les cas zx (:) est un abs min. 
Indication aux problèmes 31 à 34. Il faut appliquer le principe de Lagrange 


et trouver l'unique extrémale x (-). Le fait qu'elle est un abs min se vérifie 
directement, or on peut faire appel au théorème d'existence énoncé ci-dessus. 
A 4 
39. x) —1. 
36. S = 0, il n’y a pas de solution. I: envisager la suite minimisante 
tn (= nt si 0<LI< 7 En () = 1 si 1/n Lt<L 1. Cet exemple avait été 


avancé par Weierstrass en guise d’argument contre la démonstration de Rie- 
mann du principe de Dirichlet. 


37. x (t) = #8 (l'exemple a été considéré dans 1.4.3, la solution existe 
mais elle n’est pas de classe Cf). 
38. Dans ce problème on peut montrer l'application des méthodes duales. 


1 


lui? | 
FE: T—g din, udt=ËE, a, PER, 
0 0 
c'est un problème de Liapounov. Fonction adjointe: 


udt=E} | = 


a | (con LU) a 
0 





1 
— [ Lee t œ [ul d | 
S* En | nË pa à t " t 


otre 


[ô40}, B<1 ou B>1, B<a+i, 
_ | Ô{[—1,1]}, B—=1, a<o0, 
rt 


B—1 Inlf Aout 
B—a—1 $. , B > 1, B> a+, pT p' 1. 
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Valeur du problème: 
F(G) 0, B<1 ou 21, P<a+1, 
(ii) [El B=1, a < 0, 
2 Gt IE 
(iii) (=) T1p 2° B > 1, B > «+1. 
Pour 8 < 1 il n y a pas de solution, car l’intégrante est non convexe (voir le 
théorème de Bogolioubov dans 1.4.3), pour (i) 8 > 1 on a la solution généra- 
lisée « discontinuité en saut au point 0», pour (ii) « = 0 il y a beaucoup de 
solutions : toute fonction monotone, pour (ii) &« << 0 on a la solution généralisée 


== la solution 


ÿ 


S (ë, &, B)=— 


« discontinuité en saut au point À », pour (iii) x (t)— Et 
appartient à C1 ([0, 1]) lorsque & + 1 < 0. 

39. x (t) = —t/4 + st/4 est un abs min. 

40. x (t) = —1t/2 + (3/2 Log 2) Log t + 1/2 est un abs min. 


&i. x (&) = &8 + 25 + 1 est un abs min. 
Indication aux problèmes 39 à 41: résoudre les équations d’Euler corres- 
pondantes. 


42. x (é, Ë) = Eshi/sh T, est un abs min. 

43. x (#, 6) = Esht/sh T, si |&lch T, <L1; lorsque | Elch 7, > 1, 
alors x(t, Ë) = sh #/ch t si 0O&t<T et z(t, E) = æ+(th tr + (4 — v)), 
T<t< To, où test la solution de l’équation 7, — & = t — th +. Dans tous 
les cas x (-) est un abs min. 

44. x (4, E)—=£ si |E| 1; lorsque |] > 1, alors z (t, E)=n si 0O<t<|n|”1 
et x (#, E)=n ch (— Int") si [n| 1 <i<1, où n est la solution de l’équa- 
tion n ch (1—|n|-1)=E£#. Dans tous les cas z(:) est un abs min. 


Las Sr. h t 
45, xt, = eltt+-ÉeRE (Ce problème avait été discuté dans 1.4.3.) 


46. I: Supposons que zx (-) est la solution du problème. Alors, en vertu 
du principe du maximum de Pontriaguine, il existe une fonction p (-) telle que 
la paire (x (+), p (-)) vérifie les conditions suivantes 

T — Je 7 —p—=x, æ(0)—1, zx(æ)— p(œ) = ,p(0) —0. (1) 

Si t est le premier zéro positif de p (-) et x (t) = a 0, alors on vérifie 
aisément que la paire (x; (+), p1 (-)), où 


z(t)=a ir (V lalt+r), pilt)=a ?signap(V lalt+®) 


vérifie également (1). D’après la convexité stricte de la fonctionnelle minimi- 
sante, la solution du problème est unique et donc 


gt)=a"1(V lalt+s),  p(t)=a"?signap (V Jalt+x). 
On en tire facilement que x (+) et p (+) sont des fonctions finies obtenues en 


« collant » une quantité dénombrable de polynômes de degrés deux et quatre 
respectivement et se déterminent complètement à l’aide de trois paramètres: 


x (0) = —«, p (0) = $ et +. Dans ce cas B et t s'expriment explicitement en termes 
de à, tandis que & lui-même (dans l'hypothèse que « € (V2, 2)) vérifie l'équation 
(a) 


(42/2— at +1) (tb («)—#) dt =0, (2) 
0 | 
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euw=e(y +), vo=eo[( SE) TH]. 


On peut montrer que (2) possède effectivement la solution & sur (V 2, 2) 
et que si b et + sont les valeurs des paramètres B et t qui correspondent à &, 
on peut facilement exhiber une paire (x (+), p (-)) qui vérifie (1). Cela signifie 
que x (-) est la solution du problème donné. 


La fonction p (+) est aussi la solution d’un certain problème dual, qui est 
en fait équivalent au problème étudié dans l’article de Berkovitz et Pollard !). 
La solution des deux problèmes, dans une situation un peu plus générale, est 
contenue dans l’article de Magaril-Iliaev 2). 


co, T>n où T,=n, é£0, 
47. ST = 0, T=nr,. E=0, 
E2ctgTo, 0O<Ts< A, 


z(t; To, E)=(Esint)/sin T7 est un abs min, T,<n, 


z(t; x, 0)— À sint est un abs min. 
—— CO, To > 1/2, 


48. S(T ={ 
° Fo) 0, 0<7T,<a/2, 


x (t: Ty) =0, 0<7T,<7x/2, est un abs min, 
z(t; x/2)—Asint est un abs min. 
0, T < TT, 
Asint, |A|<1, To=rx, 
49, x (t, To)= | t, 0<t <To/2—8, 
| à VTT 20) cos (To/2—1), 1To/2—t| 6, 
U UTo—t, To/2+8<1<To 
où 0 = 6 (7,) est la solution positive minimale de l'équation ctg z = To/2 — 2. 
Indication aux problèmes 47 à 49. Dans le problème 49, la minimale existe. 
Ensuite il faut appliquer le principe du maximum et montrer qu'il existe tou- 


jours un nombre fini d’extrémales. On vérifie facilement que l’extrémale écrite 
donne la plus petite valeur à la fonctionnelle. Les problèmes 47 et 48 peuvent 


être complètement résolus par la méthode de la contrainte forcée | x | < À. 
Puis il faut résoudre des problèmes semblables au problème 49 et passer à la 
limite pour À —+ oc. 
0 Feu 
50. S (T = { on 
o) —— ©, To > x 
1) Berkovitz L. O., Pollard H., À non-classical variational problem arising 
from optimal filter problem. J. Arch. Rat. Mech. Analysis, 26 (1967), pp. 281-304, 


voir également [46]. 
2) Magaril-Iliaev G. G., Sur les inégalités de Kolmogoroff sur la demi-droite, 


Vestnik MGU, 5 (1976), pp. 33-41 (en russe). 
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Pour T, < x il y a une quantité dénombrable d’extrémales brisées ; la première 
cassure a lieu sur la courbe (t, tg t), 0 & Tt << 1/2. La courbe (avec une seule 
cassure) est de la forme 


. sin t/cos (75/2), O<t< To/2, 
UT sin (7o—t)/c0s (70/2) T2 Et ETos 


les autres se construisent d’une manière analogue. 
51. S — 0, I: Appliquer le théorème de Bogolioubov (1.4.3). 


52. x (t) = 0 est un abs min, a < T51, S — —o, à > Toi. 
53. x (t) = 32 + 2+ 1. 
54. Les points stationnaires du problème sont 
zp (t) = (2/70) sin k (n/To)t, k—1,2,..., 
la solution x (té) = x, (t) — (2/T,)-1/2 sin (x/T)) à est un abs min. La solution 


de ce problème est une bonne illustration du théorème de Hilbert de 3.5.4. 
55. La solution du problème n'existe pas toujours. Appliquons la méthode 


de contrainte forcée: | z EE 2 
To 

&= | (-hr+u VRP G-u) dt 
Th 





k—0= u (1) = Cte=s u (t) =0 
(à cause des conditions aux limites) = 1 = 2T,. Sil > 2T,, À -£ 0, i.e. on 
peut supposer que Ào — 1, Alors p (t) = —t. En prenant l'intégrale du pro- 


blème, on voit que x (-) est soit un arc de cercle, soit la courbe constituée des 
segments de droite À (t + T,) et À (To — t) joints par un arc de cercle, ou bien 
la ligne polygonale 


AGET) NES, AN Creer. 

En passant à la limite, on obtient la solution suivante du problème: pour 
2T<1< NT, z (-) est un arc de cercle de centre sur la droite £ — 0, pour 
> nl z (-) est le demi-cercle « soulevé » à la hauteur (1 — nT,)/2. 

56. x (t) — (2 sin t)/x. 

57. x (4) = —1O088 — 1282 L Gt + 2. 

58. x (t) = 5 + 35 — 4. 

59. x (t) — (34? — 13)/2. 


Indication aux problèmes 56 à 59: x (-) est partout un abs min, ce qui se 
vérifie directement. 


60. (t) = 1 (ce que l’on peut remarquer immédiatement sans calcul, 
mais on peut évidemment résoudre le problème de la manière standard). 


61. xt = —22 +1 0Li<1 et z2(D—=P—6+4 1Li< 2. 
62. xt) = t(t— To/2. 
ET —12/2, si 0O<t<(1—2-12)T,, 


12/24 (V 2—2) Tit+(V 2—3/2) T8, si (1— 2-12) TLILTo- 
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t 


64. x (à) = | G—Tu(t)dt, u(t)—=—sgn cos (2xt)/To. 
0 
Indication aux problèmes 61 à 64. Il faut démontrer l'existence de la solu- 
tion et appliquer le principe du maximum. Le point stationnaire s'avère uni- 
que et c'est lui qui donne le abs min. 
L'existence de la solution découle ici de la compacité (dans l’espace C) 
de l’ensemble des fonctions à dérivée seconde bornée (pour les conditions aux 


limites données par l’énoncé du problème) et de la continuité de la fonctionnelle 
T, 


(= [rar 
0 
1 


65. = (t— TT) lu (rt) dt, 
1 


u (t)= + sgn cos [(n +1) arc cost], 
où le signe est choisi de manière à avoir x (4) SO, tE [—1, 1]. 
1: Le principe du maximum donne ici les relations: 
DU) (4)+(— 10, 2m) (t)—ù (+) = sen ? (+), 


i.e. p(:-) est un polynôme de degré (n +1) et 
: t 
La Der | (é—T)t"1 sgn P (T) dt. 


Si p (+) est le (n + 1)-ième polynôme de Tchébycheff, alors il découle de la 
solution du problème 26 que 


1 
| (A—T)r-h-1 sgn p (tr) dt—0, RQ, Less nn, 
1 
i.e. (A) (+1) = 0, k—0, 1,..., n—1. Par] conséquent, z(:) est un 
point stationnaire, et c’est une solution, le problème étant convexe. 
66. x (4) — —#4 — 458 — 952 — 4t + À est un abs min. 


67. x (£) = t est un abs min. 
1: Le fait que c’est un abs min découle des inégalités 


2 2 
:(D= | LaeviV | x? dt —2. 


0 0 
Dans les problèmes qui suivent, nous indiquons, en règle générale, seulement 
les points stationnaires. Pour répondre à la question si ces points donnent effec- 
tivement une solution du problème, il faut un travail supplémentaire qui est 
laissé au lecteur. 


68. :0=| 





— {22414 si 0<t< V3, 
3(G—4/V 32/2—1 si V3<1<4A/V3: 
T=4V3. 


INDICATIONS, SOLUTIONS ET RÉPONSES 427 


69. u (t) = +1 où —1. 
70. Voir la solution dans 1.6.8. 


A Ti; 2(b=i-2. 


72 T=1; zD=(t+1} —1, —1<i<0; zx —1—-(t—-1), 
0<i<!. 

73, 74. Voir [14], pages 34 et 63; pour la solution du problème 75, voir 
[69], pages 435-439. 


76. t, (t) = —21, Lo (é) = 0. 
77. Les extrémales sont 
i 
| TT = 
2x (D= | sgn sin (2k+1)—- dr, k=0, +4, ...5 2(t)= Hit. 


0 
l 


78. h=C, sh —— caf D —— sin —— 
x (D =C,s 7 sin er (g 7: “, 
l | . 
7 cos = /: 
C1, C2 se déterminent des conditions 2 (To) = EE z (To) = Es. 
79. () = 0, To < T, où T est le premier zéro de l’équation (cos 7) ch T = 
— Â ; == —— O0, To > T. 
80. x (= Ci (ch t— cos + Ca (shi—sint) pour To <T; T est défini 
dans le problème 79; C et C: s'obtiennent des relations x (To; 


z (To)=E ; 5 —0 pour LT. 61—62—0; S——0o pour DT. 


81. x (t) = —1#/2 si 0<t< 1/2, 
x (t) = 9/3 — E2 + 1/4 — 1/24 si 1/2 Lt <L1. 
82. x (1) — —# + 68, 0OLt<i, 


2 (= 3 + 1, 1<i< 2. 


83. x (t) = #4 — 28 ++. 
84. La borne inférieure égale à w‘ est donnée par la fonction 


x (t) = C [(Sh ot — sin ot) (ch ©7, — cos wTs) — 
— (ch ot — cos ot) (sh ©7, + sin wT;)|, 


où & > 0 est la racine minimale de l'équation cho7,cos o7,——1, tandis 
To 


que C s'obtient de la condition | 2? dt=1. 


0 
85. x (t) = sh t/ch 2. 


86. x (#) = (t — 2) ch t/sh 2. 
87. x (t) — —sin 2 (t — 2)/sin 4. 
88. x (t) — (24 cos 2 (t — 2) — sin 2 (t — 2))/sin 4. 
89. x, (t) = sin 1sht — sh1sint, 
2 (t) = sh 1 sin t + sin 1 sh ft. 
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90. 7 (= 82 — 24, ri (t) = 4t -- 312, 


= 1 
a 2p-1)/(p-1 
91. Pour p > 1, x (t)— ap Jat+b|(2P-1/(P-1) sgn (at+b)+Ait+ ho, 


OÙ a— sign «x, 


p—1 
DE D — 
(1Ë9/811P/PTD — [6/6 —11P/PD E 
bP/(P-1) |b|(2P-1)/(p-1) 


hi = ho = 


7 ap/PD) ? a2pi(P1) 
1: Appliquer le principe de Lagrange. Pour le cas p = 1, voir le problème 92. 
92. Notons n = vo — 1 — 8To, Ë = to + Lolo — 1 — 1 + Vo + ETo- 


Alors S = S (n, Ë) = | E/Tol + In — E/Tol. 1: Poser u = x — g, on obtient 
le problème de Liapounov 


To To 
| luldt inf, 2=y, y=ute | Lu] dt + inf, 
0 0 
To To 
| u dt=n, | lu (t) dt = E. 
0 


Ensuite il faut se servir des résultats du $ 4.3. 

93. Les extrémales de ce problème ont été trouvées dans 1.6.5. Pour «& < 0, 
l’extrémale qui joint les points (fo. ro); (1, z1) est unique si x; > 0; on peut 
facilement l’inclure dans une famille d’extrémales qui recouvrent tout le plan. 
Elle donne donc un minimum absolu au problème (voir $ 4.4). 


_ 4 
AXE TZ 





À, 


/ 2 
e É SALE 


Fig. 41 


94. C’est le problème de la surface de révolution minimale. Les cxtrémales 
ont été trouvées dans 1.6.5. Pour l'étude complète du problème voir le livre 
[69], p. 427. 

95. x(t) — Y2—(t— 1). I: Déduisez du principe de Lagrange que, 
pour les problèmes d'optique géométrique (dans le cas où l’intégrante est de la 
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forme V 1 — 2?/ v (t, x), la condition de transversalité coïncide avec celle d’ortho- 


gonalité. 
96. Faisons une esquisse de la trajectoire de phase du problème (voir fig. 41; 


comparer à la figure 28). 
97. SP: Amenons le problème à la forme standard 


1 

| lulPdt inf, tt, tour, æ(0)=2(1)=0, z,(0)—1. 

0 
Dans ce problème on peut démontrer l'existence de la solution. Le lagrangien 
du problème est 

L=klu IP + p1(œs — Xe) + Pa (t2 + ut). 

Montrez que À 2 0. Alors l’équation d’Euler relativement à x et les conditions 
de transversalité prennent la forme 

—p + upa = 0, —Ps — M =0, pl =0<> p; + up; = 0, 

Pa (1) = 0. 

Ainsi x (+) et Po No vérifient la même équation linéaire de deuxième ordre et 
les deux fonctions s’annulent en un même point: £ — 1. Par conséquent, 21 (:) 


et p, (+) sont proportionnelles : Cx, (+) — p2 (+). Il découle de l'équation d’Euler 
relativement à uw (L,, — 0) que 


Pa (6) 21 @) = —plu() 1P"1 sgn u (6) = Caxf (4) = —p | u () |P-1 sgn uw (t). 


Ainsi la fonction optimale u (-) ne change pas de signe. On voit aisément que 
u > 0. Alors C < 0, donc 


u (1) = Ci (1 (PAP, C,>0, 
ie. z(-) vérifie l'équation + Cyr(Pti)/(p-1) = 0. Ayant désigné (p+1)/(p-1)= 
—q, on obtient de l'équation relativement à x l'intégrale 22/24 
+(C;/(a+ 1)» = D. Des conditions x (0)— 0, x (0)=1 on tire D—1/2 et 
x 


= | dz/V 1=(2C,/(Q+ 0 22%. La constante C, s'obtient des relations 








0 
(TS q + DJ TT 
1 di ï dz E. 
2 { V1—(2Ci/(a + 0) 2481 
ti 4 
_f (+1) \ G@+1 dn a) 
= — ne Er, LL. 
201 Vin 


où l, est un nombre connu. Ainsi l’extrémale x (-) est une fonction symétrique 
relativement à la droite t—1/2; sur le segment [0, 1/2] elle est la fonction 


X 
inverse à la fonction & — [ dz/ V 1 — kz(a*1), où k est une constante connue. 
0 


98 an { t, OK t < 1/2, 
| FO 4, pci. 
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1: Il faut appliquer la méthode de contrainte supplémentaire | u | < À, faire 
appel au principe du maximum, se servir de la relation Cx, (-)=p, (+) analogue 
à celle obtenue dans la solution du problème 97 et passer à la limite pour À oo, 

Les problèmes 97 et 98 se rapportent à la théorie de la stabilité 1). 

99. I: Le problème 99 est une des formalisations du problème bien connu 
d’'Ulam sur la superposition des segments. A la page 95 de son livre ?) Ulam 
écrit: « Supposons que deux segments de longueur 1 sont donnés dans le plan. 
Il faut déplacer continûment le premier segment sans changer sa longueur pour 
qu'il coïncide avec le deuxième et pour que la somme des longueurs des courbes 
parcourues par les extrémités du segment mobile soit minimale ». 

En guise de paramètre { pour la formalisation du problème nous avons choisi 
l’angle formé par le segment mobile avec sa position initiale. 

On peut réduire le problème à un problème de Liapounov (car l’intégrante 
ne dépend pas de x, et de x,) et l’étudier par les méthodes duales du $ 4.3 3). 
Mais il est plus simple d'appliquer le principe du maximum. Donnons la forme 
de la solution optimale pour les segments situés sur une même droite (ici nous 
avons stipulé que le point r, doit arriver au point x;, le point x, au point x}). 


Fig. 42 


Les flèches indiquent les trajectoires des points mobiles x, et x,. Le point O 
se détermine uniquement de la condition de symétrie, du fait que Oz; est paral- 
lèle à r,6, 210 à Er; et du fait que OË est perpendiculaire à 2,Ë, OË' à 2,ë. 
100. I: Le problème 100 est la omalieton d'un des problèmes sur la 
montée maximale d’une fusée 4). Le problème se réduit facilement à un pro- 
blème élémentaire de commande optimale (du fait que le lagrangien dépend 


linéairement de x): 
To: 0 < Î < li 
x o={ (v/eg) 184 (v/g) 12, <Kt<to 
PUR 
où £, est la racine positive de l’équation (y/cg) #5 + (y/g) t = xset t,, la racine . 
positive de l'équation (y/cg) t? + (y/g) 1? = 15). 


1) Voir: Borg G., Über die Stabilität gewisser Klassen von linearen Diffe- 
rentialgleichungen, Arch. matem. astr. fysik, Bd 31A, 41 (1944), 460-482. 

Levin A. Yu., Sur une zone de stabilité, Doklady Acad. Scien. U.R.S.S., 
145, 6 (1962), pp. 1021-1028. 

Levin A. Yu., Sur un critère de stabilité. Uspehi Mat. Nauk, 17, 3 (1962), 
pp. 211-212 (en russe). 

2) Ulam S., Unsolved mathematical problems. 

3) Voir également: Rvatchev M. A., Sur le problème d'Ulam sur La coïn- 
cidence des segments. Trudy sem. « Géométrie combinatoire et disposition opti- 
male », Kiev, 1973, pp. 42-52 (en russe). 

4) Kosmodemianski A. A., Konstantin Edouardovitch Tsiolkovski, Moscou, 
« Nauka », 1976, pp. 263-265. 

5) Plus en détail, voir Alexandrov Yu. L., Problème sur la montée maximale 
d'une fusée dans une atmosphère et un champ de gravitation homogènes. Vestnik 
MGU (en préparation) (en russe). 


COMMENTAIRES ET INDICATIONS BIBLIOGRAPHIQUES 


La littérature qui se rapporte à la théorie des problèmes d’extrémum est 
immense. Sans prétendre à être complets, nous ne mentionnerons ici que quel- 
ques travaux de base originaux et quelques principaux manuels, monographies 
et articles de revue. 

Chapitre I. $ 1.1. L'histoire de l'apparition des premiers problèmes de maxi- 
mum et de minimum est exposée dans [119] ainsi que dans le livre de Van der 
Waerden.déjà cité; une description de la première étape du développement du 
calcul des variations classique est donnée par [110] et [120]. Les propriétés 
extrémales du cercle et de la sphère sont exposées dans la monographie [21]. 
Le problème de transport fut déjà étudié dans l’article de Kantorovitch [11], 
premier travail en programmation linéaire. Les premiers problèmes de contrôle 
automatique furent étudiés par Bushaw [32]. Le problème de temps minimal et 
toute une série d’autres problèmes furent considérés dans la monographie fon- 
damentale de Pontriaguine, Boltianski, Gamkrélidzé et Michtchenko [14] et 
dans de nombreux autres livres sur la commande optimale ([24], [30], etc.). 

$$ 1.2 à 1.5. L'article [41] est consacré à l’histoire du principe de Lagrange. 
Ce même thème, mais dans le cadre du calcul des variations classique, est abordé 
dans les travaux [39], [401]. 

Indiquons encore quelques livres et articles qui se rapportent aux thèmes 
mentionnés dans ces paragraphes et sont accessibles à un public assez large : 
[90], [96], [98], [101], [102]. Les fondements du calcul des variations classique 
sont exposés dans les manuels [1], [7], [10]. 

Chapitre IT. $ 2.1. En plus des manuels d'analyse fonctionnelle déjà men- 
tionnés, indiquons les livres [18], [66] écrits spécialement pour « servir » la 
théorie des problèmes d’extrémum. 

$ 2.2. Le calcul différentiel dans les espaces vectoriels normés est exposé 
ce En de [KF]) dans les manuels [3], [72], [88] et les monographies [69], [77], 

12]. 
$ 2.8. Les manuels [3], [72], [88] traitent du théorème des fonctions impli- 
cites en dimension infinie. 

Le théorème de 2.8.1 est suffisamment commode pour construire la théorie 
générale, car il contient le théorème classique des fonctions implicites et le 
théorème de Lusternik sur l’espace tangent et donne également une estimation 
de la différence avec le noyau de l’application. La construction employée dans 
la démonstration était en fait déjà contenue dans l’article original [87] (voir 
également [89]). Pour d’autres démonstrations et modifications voir [69], [84]. 

$ 2.4. Pour la différentiabilité d’autres fonctionnelles explicites importan- 
tes, voir [77], [112]. 

$ 2.6. Les fondements de l’analyse convexe de dimension finie furent posés 
par Minkowski [92], [93] et Fenchel [48], [49]. L'analyse convexe dans les espa- 
ces de dimension infinie fut conçue dans les années 60 dans les travaux de Brond- 
sted [31], Doubovitski et Milioutine [42], Moreau, Rockafellar et d’autres. La 
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revue la plus complète de la théorie en dimension finie est contenue dans la 
monographie de Rockafellar [106], ainsi que (pour la partie qui concerne seule- 
ment les ensembles convexes) dans la monographie de Bonnesen et Fenchel [29]. 
Le eo en dimension infinie est exposée dans [17], [67], [69], [81], [1041, 
111]. 

Dans la période actuelle, on effectue des essais pour créer un calcul synthé- 
tique « convexe-différentiable », voir à ce sujet [35], [89], [107]. 


Chapitre III. $ 3.2. Il est difficile de dire qui fut le premier à démontrer la 
règle des multiplicateurs de Lagrange pour les problèmes différentiables à éga- 
lités et à inégalités en dimension finie. Certains travaux américains citent 
l’article de Valentine [114] et la thèse de Karush [75]. La règle des multiplica- 
teurs pour le cas d’un nombre infini d’inégalités fut démontrée par John [70]. 
Un rôle important dans cette direction fut joué par l’article de Kuhn et Tucker 
[80]. Des variantes de dimension infinie de la règle des multiplicateurs sont 
exposées dans [42], [58], [60], [69], [104], [111]. 

$ 3.3. La programmation convexe et linéaire est très largement représentée 
dans les manuels et monographies [37], [47], [59], [61], [73], [74], [86], [100], 
[101], [106], [115], [117]. 

$ 3.4. Un des premiers travaux consacrés aux conditions nécessaires pour 
les problèmes à contraintes du type d’inégalités fut [36]. On trouve une excellente 
‘exposition de la théorie en dimension finie dans le manuel de Hestenes [65], 
voir également [50], [118]. Récemment, Lévitine, Milioutine et Osmolovski 
ont développé une théorie complète des conditions de deuxième ordre pour les 
problèmes à contraintes [83], [84]. Le dernier des travaux cités possède une 
bibliographie détaillée. Nous nous sommes servis de certaines constructions de 
cet article dans notre exposé. Voir également [64], [99]. 


Chapitre IV. $$ 4.1 et 4.4. II y a beaucoup de manuels et de monographies 
consacrés au calcul des variations classique. En plus de ceux mentionnés précé- 
demment, voir [22], [28], [33], [62], [82], [116]. De la manière la plus complète 
la théorie des conditions nécessaires et suffisantes d’extrémum dans le problème 
de Lagrange est développée dans la monographie de Bliss [22] où l’on trouve 
également l'historique de cette question. Pour les relations entre le calcul des 
variations et la mécanique classique, voir [2]. 

$ 4.2. L'ébauche originale de la théorie de la commande optimale fut 
décrite dans [27] et dans l’aperçu de Pontriaguine [103], ensuite cette théorie 
constitua l'essence de la monographie de Pontriaguine, Boltianski, Gamkré- 
lidzé et Michtchenko [14], ouvrage qui donna une impulsion au développement 
de tout ce qui concerne les recherches liées au problème d’extrémum. La démons- 
tration du principe du maximum, exposée dans le $ 4.2, est une variante de la 
première démonstration, due à Boltianski, quoiqu'’elle se passe de toute méthode 
en dehors du cadre de l’analyse classique. La méthode des systèmes centrés 
avait été employée dans les travaux de Doubovitski et Milioutine. Il y a main- 
tenant beaucoup de démonstrations du principe du maximum, voir par exemple 
[25], [42] à [45], [52], [63], [69], [911]. 

La théorie de commande optimale est exposée dans les manuels [24], [52], 
[56], ainsi que dans les monographies [26], [30], [53], [79], [85], [95] et dans 
beaucoup d’autres. Les monographies citées consacrent beaucoup de place à la 
solution de divers problèmes appliqués concrets. 

$ 4.3. Le principe du maximum pour les systèmes linéaires fut pour la 
première fois démontré par Gamkrélidzé [57]. Une théorie accomplie des systè- 
mes linéaires fut élaborée par Krassovski [78]. Une revue des problèmes liés 
aux problèmes de Liapounov est donnée dans l’article [78], qui contient des 
généralisations des résultats de ce paragraphe, ainsi qu’une bibliographie 
détaillée. 

Le développement de la théorie des problèmes de Liapounov a engendré 
PR des fonctionnelles intégrales convexes; voir les travaux [34], [69], 
[108], etc. 
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Pour con iure, notons quelques monographies où le lecteur pourra se fami- 
lis riser avec certaines questions de principe de la théorie des problèmes d’'extré- 
mt , auxquelles nous n’avons pas touché dans le présent ouvrage. 

Calcul des variations à plusieurs dimensions: [76], [97]. 

Théorèmes d'existence: [56], [69], [971. 

(24] Nr suffisantes pour les problèmes de commande optimale: [23], 

Extensions des problèmes d’extrémum : [46], [66]. 

Méthodes duales dans la théorie des problèmes d’extrémum: [46], [67]. 

Méthodes numériques: [38], [94], [105], [109], [113]. 

Régimes de glissement: [55]. 

Programmation dynamique: [19], [20]. 

Contraintes de phase et contraintes mixtes: [43], [44], [54]. 

Voir également l'aperçu [51]. 
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espace arithmétique à r dimensions muni de la 
structure euclidienne usuelle: les éléments de 
R? doivent être considérés comme des vecteurs 
colonnes même s'ils sont écrits sous forme de 
vecteurs lignes 


octant non négatif dans R? 

vecteurs de la base orthonormée standard dans 
Re: = (1,0; 0): 4e (0,240 
espace arithmétique à r dimensions, dual de R?; 
les éléments de R7* doivent être considérés com- 
me des vecteurs lignes 


pour tous x € R? et p € R* 


vecteur ligne, transposé du vecteur colonne x 
norme euclidienne dans R? 


produit scalaire dans R' 


norme de l’élément x dans un espace normé 
distance de l'élément x à l'élément y 
distance de l'élément x à l’ensemble À 

boule fermée de centre x et de rayon r 


boule ouverte de centre x et de rayon r 


adhérence de l’ensemble À 

intérieur de l’ensemble À 

ensemble des vecteurs tangents (unilatères) 
à l’ensemble À au point zx 

ensemble de Lebesgue de la fonction f de 
niveau a 

espace dual de X 

élément de l’espace dual X* 

valeur de la fonctionnelle linéaire x* € X* sur 
l'élément x € X 

produit scalaire des éléments x et y dans un 
espace de Hilbert 


annulateur de l’ensemble À 

dimension de l’espace Z 

espace quotient de l’espace X par le sous- 
espace L 

espace des applications linéaires continues de 
l’espace X dans l’espace Y ; les applications de 
l’espace Z (R?, R7) peuvent s'identifier avec 
leurs matrices relativement aux bases standards 
de R7? et R7 

espace des applications polylinéaires continues 
de l'espace X® — X X ... X X dans l’espa- 
ce Ÿ 

opérateur d'identité; Æ et £, est la matrice de 
l'opérateur d'identité de Z(R?, R'), i.e. la 
matrice unité d'ordre n 

opérateur adjoint à l'opérateur À; (A*y*, x) = 
= (y*, Ax) | 
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noyau d’un opérateur linéaire 


Ker A = {x | Ar = 0} 
image d’un opérateur linéaire 
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à matrice À : yTAx = D A;jyit; 
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lorsque Ÿ est normé, on a pouræ (+-)EC(K, Y} 
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s’il est clair de quel Y il s’agit, ou lorsque 
Y=R 

espace des fonctions continues sur l'intervalle 
fermé [to, t1] 

ensemble des applications qui possèdent dans U 
des dérivées continues d'ordre inférieur ou 
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sions: « la fonction f est de classe CT (U) > 
ou « l'application F appartient à CT (U)» 
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possédant des dérivées continues d'ordre in- 
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def 
C" (A, Y) = C (A, Y) 

espace des applications du segment ACR 
dans l’espace Ÿ (généralement Y — R? ou R'*} 
possédant une dérivée continue par morceaux. 
Muni de la norme induite de l’espace C (A, Y} 
espace des applications du segment A & R dans 
l’espace Y (généralement Y = KR? ou R7*} 
qui vérifient la condition de Lipschitz, chacune 
avec sa propre constante. Muni de la norme 
induite de l’espace C (A, Y) 
dérivée de la fonction F au point x dans la 
direction du vecteur k 
première variation de l’application F au point x 
première variation selon Lagrange de l’applica- 
tion F au point zx 
n-ième variation selon Lagrange de l’applica- 
tion F au point zx 
dérivée de l’application F au point x selon 


Gâteaux 

dérivée de l'application F au point x selon. 
Fréchet 

valeur de la dérivée de l’application F au 
pes x pour le vecteur 

‘application F est différentiable selon Fréchet 
au point x 
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F" (x) LR, ho] 
hi ®F (x: k) = 
— F"(x) [h, h] 


Fr, (1, Te) (Fr, (T1 Ta)) 


[, al = {x | x = ax + 

1— a) x, 0<a<1} 
domf={reXl|f(x) < 
< +} 


epif={(x, a)EXXRI f(x) < 


KA, x € dom Î} 
ÔA 


sA 


A 
ln A 
aff À 


cone À 
conv À 


conv À 


0j (x) 
FX () 


f (x) — inf (sup, extr), x E C 


“A 
abs min (abs max, abs extr) 


x Eabsmin(;) (absmax (3), 


abs extr (3)) 


loc min (loc max, loc extr) 


x € loc min (3) (oc max (à), 
loc extr (3)) 
JS BR, F, P 


@ 


= LE, 2) ou 
L= L(t,zx,x,u) 


l'application F est strictement différentiable 
au point x 

dérivée seconde de l’application F au point x 
selon Fréchet 

valeur de la dérivée seconde (envisagée comme 
forme bilinéaire) sur le couple de vecteurs 
h1 et ho 


différentielle seconde de l’application F au 
point x 

dérivée partielle relativement à zx, (à x.) de 
l'application F, i.e. dérivée de l'application 
mt F (ty te) (ot FF (x To) 


segment joignant les points zx, x, 
domaine effectif de la fonction f: X +R 


épigraphe de la fonction f: X —R 
indicatrice de l’ensemble À 

fonction d'appui de l’ensemble À 
fonction de Minkowski de l’ensemble À 
enveloppe linéaire de l’ensemble À 
enveloppe affine de l’ensemble À 
enveloppe conique de l’ensemble À 
enveloppe convexe de l’ensemble À 


adhérence convexe: coïncide avec l’adhérence 
de l’enveloppe convexe de l’ensemble À 
subdifférentielle de la fonction f au point x 
fonction conjuguée à la fonction f(-); trans- 
formée de Young-Fenchel de la fonction f 
notation pour un problème d’extrémum 


solution d’un problème d’extrémum 
minimum (maximum, extrémum) absolu 


x donne un minimum (maximum, extrémum) 
absolu au problème (3) 
minimum (maximum, extrémum) local 


x donne un minimum (maximum, extrémum) 
au problème (3) 

fonctionnelles dans les problèmes du calcul 
des variations et de commande optimale 
fonctionnelle quadratique du problème secon- 
daire du calcul des variations 


lagrangien 

fonction de Lagrange 
hamiltonien 

fonction de Pontriaguine 
fonction de Weierstrass 
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Adhérence 
convexe d’un ensemble 209 
— d’une fonction 210 
Aiguille élémentaire 87, 323 
Annulateur 122 
Application 
affine 136 
canonique 115 
de classe Cr (U) 149 
contractante 156 
différentiable selon Fréchet au 
point 133 
d'évaluation 176 
intégrale 172, 173 
inverse 123, 163 
mesurable 335 
polylinéaire 137 
strictement différentiable 133 


Champ 
d'extrémales 387 
— central 395 
de vecteurs 398 
Classe 
de contiguité 115 
d'éléments admissibles 31 
de problèmes d’extrémum 39 
Combinaison 
affine 202 
conique 202 
convexe 202 
linéaire 202 
Commande 126, 317 
Condition(s) 
de concordance des signes 233, 239 
Pen penenee des signes 233, 


de Jacobi 375 

de Legendre 371, 373 

— sous la forme forte 375 
aux limites 41, 80, 300 


Condition(s) 
de Lipschitz 128 
de non-négativité 52 
de négativité stricte 231 
de positivité stricte 231 
de non-rigidité complémentaire 
52, 233, 239 
de régularité forte 250 
de Slater 52 
de transversalité 17, 63 
de Weierstrass 75, 215, 370 
de Weierstrass-Erdmann 322 
Cône 201 
dual 224 
Contrainte(s) 30 
holonomes 79 
isopérimétriques 300 
de phase 79, 319 
Courbe de Newton 99 


Demi-espace(s) 120 
fermés 208 
ouverts 208 
Dérivée 
de f au point 45, 46 
de Fréchet 133 
—, existence 145 
de Gâteaux 133 
—, existence 145 
partielle 46, 145 
— relativement à x et à y d’une 
application 146 
suivant une direction donnée 131 
d'ordres supérieurs 148 
Déterminant de Gram 291 
Deuxième fonction adjointe 215 
Différentielle 134, 153 
Distance d’un point à un ensemble 
264 
Droite réelle augmentée 30 
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Elément orthogonal 288 
Ensemble(s) 

convexe 51, 201 

— de la droite 203 

dominé 206 

de Legendre 382 
Enveloppe 

affine 202 

conique 202 

convexe 202 

linéaire 55, 202 
Epigraphe d’une fonction 51, 206 
Equation(s) 

différentielles linéaires 184 

duale 303, 322 

d'Euler 17, 57, 61, 370 

d’Euler-Lagrange 81 

d'Euler-Poisson 78, 314 

de Hamilton-Jacobi 384 

de Jacobi 373 
Espace 

de Banach 113 

dual 113 

métrique 113 

normé 112 

quotient 115 

tangent 165 
Exemple 

de Boltz 69 

de Hilbert 64 
Extrémale 58, 379 

canonique 379 
Extrémum 13, 30 

faible 58, 300, 368 

fort 66, 368 

lié 40 

local 30 


Famille duale 255 

Fonction(s) 
absolument continue 128 
adjointe 215 
admissibles 369 
affines 2410 
d'appui 212 
— d'un ensemble 265 
canonique 4129 
convexe 51, 206 
— d’un ensemble 265 
— et homogène 117 
différentiable au point 45, 46 
équivalentes 349 
fermée 210 
de Hamilton 304, 375 
impropre 206 


Fonction(s) 
d'inclinaison 388 
intégrable 126 
— Jocalement 178 
de Lagrange 47, 51, 80, 84, 239, 
241, 251, 300, 320, 353 
— élargie 255 
mesurable 126 
de Minkowski 117 
de Pontriaguine 303, 320 
propre 206 
semi-continue inféricurement 210, 
240 
de Weierstrass 74, 215, 371 
Fonctionnelle 30 
de Boltz 41, 63, 234, 300 
intégrale 41, 171, 325 
invariante relativement à une 
famille d'applications 402 
mixte 41 
terminale 41 
Formalisation 30 
Forme 
de degré n 137 
de Legendre 296 
Formule 
des accroissements finis 142 
de Dirichlet 131 
de Newton-Leibniz 127 
Front d'onde 22 


Graphique élargi 369 


Hyperplan 120, 208 


Indicatrice 207 
Indice d’une forme quadratique 296 
Inégalité 
de Cauchy 208 
de Cauchy-Bouniakovski 409 
sur l’entropie 208 
de Gronwall 182 
de Hôlder 410 
isopérimétrique 15 
de Jenssen 51, 206 
entre la moyenne arithmétique 
et la moyenne géométrique 409 
pour les moyennes exponentiel- 
les 409 
de Young 216 
Intégrale 
d'énergie 62 
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Intégrale 
de l'impulsion 61 
invariante de Hilbert 388 
Intégrante 58 
Invariant intégral de Poincaré-Car- 
tan 382 


Lagrangien 58, 301, 320 
Lemme 
sur l'accroissement de la fonc- 
tionnelle 90 
sur l’annulateur du noyau d’un 
opérateur régulier 125 
sur l’application inverse à droite 


d'arrondissement des angles 67 

sur les conditions de minimum 
dans le problème élémentaire 
de commande optimale 359 

sur le cône dual 265 

— dans un espace de dimension 
finie engendré par un nombre 
fini de points 259 

sur la convexité de l’image 354 

de Dubois-Raymond 60 

— généralisé 307 

sur les fonctionnelles intégrales 
325, 4 

de Hoffmann 268 

sur l’image fermée 124 

de Lagrange 59 

sur la mesurabilité composée 352 

du minimax 269 

sur la non-trivialité de l’annula- 
teur 123 

sur le paquet d’aiguilles 325, 334 

sur les propriétés de la variation 
élémentaire 87 


de conservation 399 

— de l'énergie 406 

— de l'impulsion 407 

— du moment d’impulsion 407 
de Snellius 23, 96 


Matrice 
définie positive 286 
fondamentale 186, 198 
de Gram 291 
de Jacobi 148 
Maximum 31 
absolu 31, 68, 387 
faible 58, 373, 375 


445 


Maximum 
fort 66, 68 
local 31 
Méthode(s) 
des multiplicateurs de Lagrange 
47 


— — pour les problèmes diffé- 
rentiables à égalités et inéga- 
lités 241 
des perturbations 253 
des variations 61 
Mineur principal d’une matrice 287 
Minimum 31 
absolu 31, 68 
faible 58, 80, 373, 375 
fort 66, 68, 75, 369, 397 
local 31, 66, 68 
Multiplicateurs de Lagrange 47, 51, 
241, 301, 321 


Nombres impropres 205 
Norme 112 
équivalente 113 


Opérateur 
auto-adjoint 292 
compact 292 
des conditions aux limites 175 
de Nemytski 168, 170 
de relation différentielle 171 


Paire de problèmes duaux de pro- 
grammation linéaire 262 
Paquet d’aiguilles 324 
Partie 
intégrale d’un problème 301 
terminale d’un problème 301 
Perturbation du problème 253 
Point(s) 
admissibles pour la contrainte 31 
conjugué 373 
extrême 350 
selle 55 
stationnaire 45, 46, 48, 58, 230 
de Torricelli 21, 97 
Polyèdre convexe 203, 208 
Première variation de Lagrange 59 
— — de l’application F au point 
x 132 
— — suivant Lagrange 132 
Principe 
d'Huygens 23 
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Principe 

de Lagrange 50, 92, 238, 241 

— pour le problème de commande 
optimale 322 

— — de Lagrange 302 

— — de Liapounov 353 

— — de programmation convexe 
252 


ne HS LE de Pontriaguine 18, 
— — pour le problème à extré- 
mité libre 86 
du minimum 52 
variationnel de Fermat 22 
Problème(s) 
d’Apollonios 18, 33, 43, 93 
— généralisé 409 
d’Archimède 18, 32, 43, 93 
de Boltz 42, 62 
— à temps non fixe 234 
du brachistochrone 25, 37, 44, 109 
du calcul des variations classique 
aux dérivées d'ordre supérieur 
78, 82, 311 
— — — élémentaire 42, 57, 368 
— — — vectoriel 42 
de Cauchy 180, 183, 185, 188, 197 
de commande optimale 42, 82, 
315, 320 
— — élémentaire 237, 359 
— — —, conditions de minimum 
237, 399 
— — linéaire relativement aux 
variables de phase 347 
convexe élémentaire 42, 228 
de Didon 15, 16 
— à contraintes de phase 17 
dual 255 
d’'Euclide 18, 31, 43, 93 
d’extrémum 13, 19, 30, 39 
— sans contraintes 31 
— différentiable à contraintes 
sous forme d’égalités et d’iné- 
galités 40, 241, 243, 276, 278, 
282 
— — élémentaire 40, 228 
— — — de dimension finie 47 
— géométriques 92 
— lié 47 
isopérimétrique 75, 82 
— classique 13, 35, 43, 104, 107 
isopiphane 14, 19 
de Kepler 21, 32, 43, 95 
— généralisé 409 
de Lagrange 41, 79, 318 
mo forme de Pontriaguine 79, 
00 
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Problème(s) 
de Liapounov 349, 353 
de Mayer 42 
de Newton aérodynamique 28, 33, 
43, 
d'optimisation 13 
de programmation convexe 42, 
51, 351 
— linéaire 42, 258 
— — de dimension finie 259 
— —, duaux 262 
— —, élémentaire 233 
de rationnement 29, 38, 44 
de réfraction de la lumière 22, 
43, 95 
de Steiner 21, 33, 43, 96 
de surface de révolution minima- 
le 109 
de Tartaglia 19, 97 
de Tchaplyguine 37, 104, 108 
de temps minimum 30, 38, 43, 
de transport 29, 38, 44 
Processus 
admissible 347 
de commande 80, 83, 300 
— admissible 80, 83, 300, 317 
optimal 83, 317, 347 
— localement 317 
— dans le sens faible 300 
Produit d'espaces 114 
Programmation 
convexe 42, 51, 251 
linéaire 29, 42, 233, 258 


Relations différentielles 41, 300 


Simplexe de dimension n 203 
Solution 

d’une équation différentielle 177 

d’un problème d'’extrémum 31 
Subdifférentielle 220 

de la norme 221 
Suite faiblement convergente 292 
Supplémentaire orthogonal 288 
Système 

adjoint 184 

hamiltonien canonique 304, 375 


Terminant 320 
Théorème(s) 
sur l'application inverse 163 
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Théorème(s) 

de Banach sur l'opérateur in- 
verse 123 

de Bogolioubov 70 

de Carathéodory 203 

sur la dépendance différentiable 
des solutions en fonction des 
conditions initiales 193, 197 

des dérivées mixtes 151 

sur la différentielle totale 146 

de Doubovitski-Milioutine sur la 
subdifférentielle d’un maxi- 
mum 225 

— sur l'intersection des cônes 224 

de dualité pour les problèmes 
de programmation convexe 257 

— — — linéaire 262 

— pour le problème de la plus 
courte distance 265 

— pour les problèmes de Lia- 
pounov 361 

sur l’espace quotient 115 

d'Euler-Lagrange 81, 301 

d'existence (programmation li- 
néaire) 259 

sur l'existence d’une solution, 
global 188 

— —, local 179 

de Fenchel-Moreau 218 

de Fermat 21, 44, 229 

— pour les fonctions de n varia- 
bles 46 

de la fonction inverse 48 

des fonctions implicites 155 

— —, classique 160 

sur la formule de Taylor 153 

de Hahn-Banach 118 

sur l’invariant intégral 380 

de Jacobi (conditions suffisantes 
d’extrémum faible) 375, 395 

de Krein-Milman 350 

de Kuhn-Tucker 51 

—, forme subdifférentielle 251 

de Lagrange de la moyenne 142 
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Théorème(s) 

de Lebesgue 129 

de Liapounov 350 

de Lusternik 4167 

du minimax 258 

de Minkowski 213 

de Moreau-Rockafellar 222 

de la moyenne 143 

de Nœter 402 

de Riesz 129 

de séparabilité en dimension fi- 

nie 52, 55 

—, deuxième 122 

—, premier 4120 

d'unicité 183 

de Weierstrass 92, 240 

— sur les conditions suffisantes 

d’extrémum fort 396 

Théorie 

de la commande optimale 30 

de Hamilton-Jacobi 25 

de programmation dynamique 25 
Trajectoire de phase 317 
Transformée 

de Legendre 215 

— classique 217, 376 

de Young-Fenchel 215 
Triplet admissible 312 


Variables 
de commande 79 
de phase 79 
Variation(s) 
en aiguille de la commande 87, 
323 


— du processus 87 
— de la trajectoire 87, 323 
selon Lagrange 155 
Variété affine 201 
Vecteur 
tangent 165 
unilatère 4165 


